Einleitung 

1.0 Einleitung

 1.3 Allgemeine Beschreibung und Funktionsweise von neuronalen Netzen
/14/

Ein neuronales Netzwerk (Abkürzung NN) ist ein System, das aus miteinander verbundenen Prozeßelementen besteht, die Informationen verarbeiten können und als Neuronen bezeichnet werden. Man unterscheidet generell zwischen biologischen und künstlichen neuronalen Netzwerken. Im Fall eines biologischen neuronalen Netzwerks sind die Neuronen Nervenzellen und das Netzwerk besteht aus Dendriten, Axonen und Synapsen. Bei den verarbeiteten Informationen handelt es sich um biologische Informationen, die im wesentlichen aus Nervenimpulsen bestehen. In einem künstlichen neuronalen Netzwerk sind die Neuronen als mathematische oder physikalische Modelle mit mehreren Ein- und Ausgängen realisiert, deren mathematisches Verhalten prinzipiell den biologischen Neuronen entspricht. Die dort verarbeiteten Informationen kann man generell als Muster bezeichnen. Dabei kann es sich um Signale, Bitmuster oder Zahlenwerte handeln, die von einem künstlichen neuronalen Netzwerk meistens in Form eines Eingangsmusters verarbeitet werden und in Form eines Ausgangsmusters ausgegeben werden. Die Abbildung 1.1 zeigt die schematische Darstellung eines künstlichen neuronalen Netzes.

Abb. 1.1 Schematische Darstellung eines künstlichen neuronalen Netzes

Eine typische NN-Anwendung besteht immer aus zwei Phasen: In der ersten Phase - der Lern- bzw. Trainingsphase werden die Gewichtungen des NN anhand von Beispielen für Eingangs- und Ausgangsmuster so ermittelt, daß das NN den systematischen Zusammenhang zwischen den Beispielsmusterpaaren erfassen kann. In der zweiten Phase der eigentlichen Anwendungsphase - werden dem Netz mit seinen gelernten Gewichtungen Eingangsmuster präsentiert, aus denen es dann Ausgangsmuster erzeugt und somit eine bestimmte Musterverarbeitungsaufgabe löst.


1.4 Besondere Eigenschaften von neuronalen Netzen
/4//14/

Neuronale Netze verfügen über einige besondere Eigenschaften, die sie von anderen klassischen Methoden der Signalverarbeitung und Mustererkennung  unterscheiden.

Lernfähigkeit: Bei den klassischen Methoden muß der Mensch selbst die Aufgabe analysieren und mit Hilfe eines Programmes den Computer komplizierte Einzelschritte zur Lösung der Aufgabe anweisen. Mit Hilfe der NN wird der Schritt des Programmierens durch den des Trainings abgelöst "Trainieren statt Programmieren". Aus unterschiedlichen Beispielsmusterpaaren können systematisch die essentiellen Zusammenhänge extrahiert werden. Ein NN kann in der Anwendungsphase Eingangsmuster korrekt verarbeiten, die es in der Trainingsphase nie gesehen hat (Verallgemeinerungsfähigkeit).

Verarbeitung fehlerhafter und unvollständiger Informationen: Praktisch alle Netzwerktypen besitzen die Fähigkeit zur Verarbeitung von fehlerhafter und unvollständiger Information, d.h. aus einem Eingangsmuster, das verrauscht ist, kann in vielen Fällen trotz der   fehlerhaften Information noch ein korrektes Ausgangsmuster generiert werden. Auf diese Weise können fehlerhafte Eingangsmuster korrekt verarbeitet werden oder in fehlerfreie Eingangsmuster transformiert werden. Dasselbe gilt für unvollständige Eingabemuster (als Sonderfall der fehlerhaften Muster), die mit Hilfe von NN vervollständigt werden können. Auch hier sind neuronale Netze den meisten "klassischen Methoden" überlegen, da diese im Fall von fehlerhaften oder unvollständigen Eingaben meistens versagen.

Adaptives Verhalten: Einige Netzwerktypen besitzen neben der Fähigkeit zum Lernen während der Trainingsphase auch die Fähigkeit zum Weiterlernen in der Abrufphase und weisen somit ein adaptives Verhalten auf. In diesem Fall werden die in der Lernphase ermittelten Gewichtungen in der Abrufphase nicht konstant gehalten, sondern werden mit Hilfe der Muster, die dem Netzwerk während der Abrufphase präsentiert werden, laufend angepaßt, d.h. nachadaptiert. Nicht alle Netzwerktypen besitzen diese Fähigkeit. Auch sie ist jedoch in vielen Anwendungsfällen sehr wünschenswert, beispielsweise wenn NN mit zeitvarianten Systemen zusammenarbeiten, bei denen eine Anpassung an langsam veränderliche Bedingungen erforderlich ist.

Massive Parallelität: Neuronen können als autonome Systeme betrachtet werden, deren interne Operationen voneinander unabhängig sind und die nur durch die gewichteten Verbindungen miteinander kommunizieren. Dies hat insbesondere die Konsequenz, daß ein NN als ein Netzwerk von unabhängigen, parallel arbeitenden Einzelsystemen betrachtet werden kann.
Neuronen könnten auf jeweils einem extra Prozessor realisieren werden, der in diesem Fall ein sehr einfacher Mikroprozessor sein kann. Jeder dieser Prozessoren kann zur Gesamtleistung des Netzes beitragen. Somit würde sich die Gesamtleistung des Netzes wesentlich erhöhen. Es ist ebenfalls zu beachten, daß aufgrund der sehr einfachen Ausführung solcher Prozessoren die Einzelelemente eines solchen Hardware-Netzes sehr preiswert wären und große Netze mit sehr hoher Rechenleistung kostengünstig realisiert werden können.
Der neuronale Ansatz steht dabei in einem gewissen Gegensatz zu den Bemühungen, sequentielle Algorithmen durch spezielle Compiler automatisch zu parallelisieren, um sie dann auf Parallelrechnern ablaufen zu lassen, die mit einer größeren Anzahl von relativ komplexen Prozessoren in paralleler Verarbeitungsweise operieren. Es ist zu erwarten, daß sich beide Ansätze zukünftig ergänzen werden. Die Parallelrechner werden einerseits bei Problemen eingesetzt werden, wo exakte Informationen in großer Menge und mit großer Geschwindigkeit verarbeitet werden müssen und andererseits bei der Verarbeitung von unscharfer Information, z.B. für die Erkennung unterschiedlicher Muster in stark gestörten Signalen.
Neuronale Netze haben gegenüber herkömmlichen Algorithmen den entscheidenden Vorteil, daß sie eine natürliche Parallelität aufweisen; eine Parallelisierung der Algorithmen ist nicht notwendig, da sie von sich aus bereits parallel sind. Bei sequentiellen Algorithmen ist ja bekanntlich durch Analyse der Algorithmen oder mit Hilfe spezieller Compiler eine oft schwierige und aufwendige Parallelisierung erforderlich.

 Hardware-Implementierbarkeit: NN lassen sich "maßschneidern" für bestimmte Anwendungen und sie können günstig vollständig hardwaremäßig realisiert werden. Hohe Verarbeitungsgeschwindigkeiten ermöglichen Echtzeitanwendungen unter den verschiedensten Einsatzbedingungen, ohne daß aufwendige Rechentechnik mit Echtzeit-Betriebssystemen verwendet werden müssen.
Die NN gehören zu den wenigen Paradigmen in der KI-Forschung, die sich effizient in Hardware implementieren lassen. Ein solcher Versuch wurde z.B. auch für regelbasierte Paradigmen aus dem Bereich der Logik und der Deduktionssysteme unternommen und hat sich beispielsweise auf die Entwicklung von LISP-Maschinen ausgewirkt. Diese haben sich jedoch aufgrund ihrer hohen Preise, großen Dimensionen und Inkompatibilität zu anderen Systemen nicht durchsetzen können. So sind die meisten regelbasierten Systeme reine Software-lmplementierungen.
 
Fehlertoleranz (Neuronenausfall): Unmittelbar verbunden mit der Eigenschaft der massiven Parallelität und der Hardware-Implementierbarkeit von NN ist die Fehlertoleranz dieser Systeme. NN zeigen im Allgemeinen bei Ausfall von einzelnen Neuronen keine nennenswerten Veränderungen der Netzantwort, es kommt nur zu geringfügigen Qualitätseinbußen  (graceful degradation), bspw. leicht verschlechterte Klassifikationsraten. Dies gilt natürlich nur für den Fall, daß die Anzahl der ausgefallenen Neuronen relativ klein im Vergleich zur Gesamtanzahl der Neuronen im Netz ist. Dabei ist in den meisten Fällen der Übergang zu einem deutlich schlechteren Netzverhalten fließend, d.h. mit einer größer werdenden Anzahl von ausgefallenen Neuronen ist eine kontinuierliche Verschlechterung des Netzverhaltens verbunden; ein plötzlicher Totalausfall des Netzes beim Ausfall einer bestimmten Anzahl von Neuronen ist i.a. nicht zu beobachten.

NN besitzen jedoch auch eine Reihe von Nachteilen, die dazu führen, daß sie für manche Anwendungsgebiete schlecht oder gar nicht geeignet sind.

Wissensextraktion: Wenn ein NN die Mustertransformation, bspw. eine Klassifikationsaufgabe, gut erfüllt, so besteht in vielen Anwendungsgebieten das Ziel, dieses Wissen des Netzes zu extrahieren. Viele Erkenntnisfortschritte basieren letztlich auf einem solchen Extraktionsvorgang unter Verwendung von Modellvorstellungen.
Die Extraktion des Wissens aus der Gewichtsmatrix ist nicht formalisiert. Sie ist in einigen Anwendungsfällen möglich, in anderen dagegen bleibt die Wissensextraktion aus den NN unbefriedigend.

Implementierbarkeit von Wissen:
Bereits vorhandenes Wissen auf speziellen Fachgebieten ist in NN schlecht integrierbar. Für wohldefinierte Problemstellungen der KI gibt es aus Sicht der Algorithmisierbarkeit deutlich bessere Verfahren. Die hier verwendeten Netze führen zu Einschränkungen.



1.5 Neuronale Netze als Teilgebiet der künstlichen Intelligenz
/14/

Die NN sind zur Zeit ein modernes und sehr dynamisches Forschungsgebiet der künstlichen Intelligenz. Abb. 1.2 zeigt Teilgebieten der KI, zu denen eine enge Verflechtung besteht.

  Abb. 1.2 Interaktion der NN mit anderen Teilgebieten der KI

NN lassen sich erfolgreich für Problemlösungen aus dem Bereich der Bilderkennung, bspw. zur Segmentierung von Objekten, aus dem Bereich Bildverstehen, das die Analyse komplexer Muster und die Analyse von Szenen zum Gegenstand hat, anwenden. Weitere wichtige Anwendungen liegen im Bereich der natürlichsprachlichen Systemen vor, bspw. für die Phonem-Erkennung. Neben der Spracherkennung beinhaltet dieses Gebiet auch die Sprachsynthese.
Erfolgreiche und vielversprechende Anwendungen von neuronalen Methoden sind für die Robotik bekannt, bspw. für Robot Vision und für die motorische Steuerung von 6-Achsen-Robotern (Robot Control).
Bereiche, mit denen keine unmittelbaren Verbindungen bestehen, sind die Logik und das automatische Beweisen.
Eine weitere Anwendung der NN besteht im Bereich der Expertensysteme. Komplexe  heterogene Assoziativspeicher lassen sich mit NN realisieren.
Ansonsten werden Expertensystemen überwiegend mit regel- und wissensbasierten Ansätze realisiert, die typischerweise in Form von Deduktionskomponenten und Grammatiken zu finden sind.
NN basieren auf konnektionistischen Ansätzen. Sie beschäftigen sich mit der subsymbolischen Verarbeitung von Informationen und ahmen Prinzipien der menschlichen Sinneswahrnehmung und der kortikalen Tätigkeit nach.
 
Im hier gewählten Anwendungsgebiet der EEG-Analyse ist jedoch ein nicht klar definiertes  Erkennungsproblem gegeben. Das Expertenwissen auf dem Gebiet der Mikrostate- Charakterisierung ist bislang noch vage und von geringem Umfang. Deshalb eignen sich für diese Analysen die NN mit ihren bereits erwähnten Vorzügen.
 


Einleitung