Künstliche Intelligenz

Was ist ein neuronales Netz?

Was ist ein neuronales Netz? Um anzufangen, schauen wir uns eine Art künstliches Neuron namens Perzeptron näher an. Perzeptrone wurden in den 1950er und 1960er Jahren vom Wissenschaftler Frank Rosenblatt entwickelt, inspiriert durch frühere Arbeiten von Warren McCulloch und Walter Pitts. Heutzutage ist es üblicher, andere Modelle künstlicher Neuronen zu verwenden – in diesem Buch und in vielen modernen Arbeiten über neuronale Netze wird das Hauptmodell des Neurons als Sigmoid-Neuron bezeichnet. Wir werden in Kürze zu sigmoiden Neuronen kommen. Aber um zu verstehen, warum sigmoide Neuronen so definiert sind, wie sie sind, lohnt es sich, sich die Zeit zu nehmen, um zuerst Perzeptrone zu verstehen.

Wie funktionieren Perzeptrone

Ein Perzeptron P nimmt mehrere binäre Eingabewerte x1, x2, x3, … und produziert daraus einen einzige binäre Ausgabewert.

Im Beispiel hat das Perzeptron drei Eingänge: x1, x2 und x3. Es könnte aber auch mehr oder weniger Eingänge haben. Rosenblatt schlug eine einfache Regel zur Berechnung der Ausgabe vor. Er führte Gewichte, w1, w2, …, reelle Zahlen ein, die die Wichtigkeit der jeweiligen Eingänge für die Ausgabe ausdrücken. Die Ausgabe des Neurons, 0 oder 1, wird dadurch bestimmt, ob die gewichtete Summe \(\sum_j w_j x_j\) kleiner oder größer als ein bestimmter Schwellenwert ist. Genau wie die Gewichte ist auch die Schwelle eine reelle Zahl, die ein Parameter des Neurons ist. Um es in präzisere algebraische Begriffe zu fassen:

\(\begin{eqnarray}
\mbox{output} & = & \left\{ \begin{array}{ll}
0 & \mbox{wenn } \sum_j w_j x_j \leq \mbox{Schwellenwert} \\
1 & \mbox{wenn } \sum_j w_j x_j > \mbox{Schwellenwert}
\end{array} \right.
\tag{1}\end{eqnarray}\)

Das ist auch schon alles, wie ein Perzeptron funktioniert!

Das ist das grundlegende mathematische Modell. Eine Möglichkeit, über das Perzeptron nachzudenken, ist, dass es ein Apparat ist, der Entscheidungen trifft, indem er Fakten abwägt. Betrachten wir dazu ein Beispiel. Es ist kein sehr realistisches Beispiel, aber es ist einfach zu verstehen, und wir werden bald zu realistischeren Beispielen kommen. Angenommen, das Wochenende steht vor der Tür, und wir haben gehört, dass es in Ihrer Stadt ein Käsefest geben wird. Wir mögen Käse und versuchen zu entscheiden, ob wir zum Festival gehen willst oder nicht. Wir können eine Entscheidung treffen, indem wir drei Faktoren abwägen:

  1. Ist das Wetter gut?
  2. Möchte unser Freund bzw. Freundin uns begleiten?
  3. Ist das Festival in der Nähe der öffentlichen Verkehrsmittel? (Uns steht kein Auto zur Verfügung).

Wir können diese drei Faktoren durch entsprechende binäre Variablen x1, x2 und x3 repräsentieren. Zum Beispiel hätten wir x1 =1, wenn das Wetter gut ist, und x1 = 0, wenn das Wetter schlecht ist. Ebenso x2 = 1, wenn unser Freund oder Freundin gehen möchte, und x2 = 0 x, wenn nicht. Und ebenso wieder für x3 und öffentliche Verkehrsmittel.

Nun, nehmen wir an, wir lieben Käse, so sehr, dass wir gerne zum Festival gehen, auch wenn unser Freund oder unsere Freundin uninteressiert ist und das Festival schwer zu erreichen ist. Aber vielleicht verabscheuen wir schlechtes Wetter, und es gibt keine Möglichkeit, bei schlechtem Wetter zum Festival zu gehen. Mit Hilfe von Perzeptronen können wir diese Art der Entscheidungsfindung modellieren. Eine Möglichkeit, dies zu tun, besteht darin, ein Gewicht w1 = 6 für das Wetter und w2 = 2 und w3 = 2 für die anderen Bedingungen zu wählen. Der größere Wert von w1 gibt an, dass das Wetter für uns eine große Rolle spielt, viel mehr als die Tatsache, ob unser wir in Begleitung hingehen oder nicht, oder die Nähe der öffentlichen Verkehrsmittel. Angenommen, wir wählen einen Schwellenwert von 5 für das Perzeptron. Mit diesen Entscheidungen implementiert das Perzeptron das gewünschte Entscheidungsmodell und gibt 1 bei gutem Wetter und 0 bei schlechtem Wetter aus. Dabei spielt es keine Rolle, wir in Begleitung fahren oder ob die öffentlichen Verkehrsmittel in der Nähe sind.

Indem wir die Gewichte und den Schwellenwert variieren, können wir verschiedene Modelle der Entscheidungsfindung erhalten. Nehmen wir zum Beispiel an, dass wir stattdessen einen Schwellenwert von 3 gewählt haben. Dann würde das Perzeptron entscheiden, dass wir zum Festival gehen, wenn das Wetter gut war oder wenn das Festival in der Nähe von öffentlichen Verkehrsmitteln ist und unser Freund oder Freundin bereit war, sich uns anzuschließen. Mit anderen Worten, es wäre ein anderes Modell der Entscheidungsfindung. Wenn wir den Schwellenwert senken, sind wir eher bereit, zum Festival zu gehen.