Aufbau der Quelldaten
Die Quelldaten bestehen aus den Eingabevektoren und den dazugehörigen
Klassen. Diese Quelldaten müssen folgendermaßen formatiert sein.
-
maximal 40000 Eingabevektoren mit dazugehörigen Klassen
-
maximal 63 Komponenten (Merkmale) je Eingabevektor
-
maximal 255 verschiedene Klassen insgesamt
-
es sind keine Leerzeilen erlaubt
-
jeden Eingabevektor steht in einer Zeile
-
die Anzahl der Komponenten je Zeile muß konstant sein
-
die erste Zahl der Zeile gibt die Klasse des Eingabevektors an
(Beim SOM dient die Klasse zur Kalibrierung der Som-Karte)
-
eine Klasse wird als Ganzzahl angegeben vom Typ byte (0..255)
-
die Komponenten des Eingabevektors werden als Dezimalzahlen angegeben
gültig ist die Dezimalschreibweise (z.B. 12,3 bzw 12.3) und
die wissenschaftliche Schreibweise (z.B. 1,23e02 bzw 1.23E02)
-
Alle Zahlen einer Zeile werden durch Leerzeichen getrennt
-
Als Dezimaltrennzeichen ist der Punkt bzw. das Komma erlaubt
Beispiel einer Quelldatei mit gemischter Schreibweise
-
Dezimaltrennzeichen: Punkt
-
Eingabevektor mit 3 Merkmalen
-
4 Eingabevektoren
-
3 Klassen insgesamt
1 1.23456e01 11.2 22.567
2 1.23456e02 99 2234.99
3 1.23456e03 33.56 88
2 1.236E02 99.000 2234.99