Finde ich prima, dass es dich interessiert, Jan.

Zur Theorie der neuronalen Netze gibt es ja unglaublich viel zu sagen. Gehen wir einfach Schritt für Schritt vor, und bei weiteren Fragen, fragen. Mein Prof (NN ist sein Spezialgebiet) würde eh davon ausgehen, dass ich alles beantworten kann, also stelle ich mich dem gerne.
Ganz prinzipiell werden NNs für zwei Arten von Lernproblemen verwendet:
- lerne zu je einer Situation eine Bewertung, oder
- lerne zu je einer Situation einen "Vorschlag", typischerweise eine Aktion.
NNs mit Lernverfahren gibt's kostenlos zum download. Herausforderung bei der Verwendung von NNs ist, die gestelllte Aufgabe möglichst geeignet durch eine der beiden Varianten zu beschreiben (Stichwort: feature selection.) Je besser der Zusammenhang von Eingabe und Ausgabe ist und je kleiner der Eingaberaum (=Suchraum) ist, desto leichter lässt sich das Problem lernen - oder anders herum: desto kompliziertere Aufgaben lassen sich bei gleichem Zeitaufwand lernen.
NNs sind geeignet für Aufgaben, die nicht zu klein und nicht zu groß sind. Zu klein wäre beispielsweise Tic-Tac-Toe. Als Trainingsbeispiel zum Probieren zwar geeignet, in der Praxis würde sich aber eine vollständige Auflistung und Beantwortung aller Situationen aber empfehlen. Ein zu großes Problem ist z.B. die Wettervorhersage. NNs können zwar theoretisch jede mathematische Funktion erlernen, nach heutigem Wissensstand würde das Training einer Wettersimulation allerdings die Menschheit überdauern.

Realistische herausfordernde Lernprobleme haben niedrig zweistellig viele reellwertige Eingaben.
Deine beiden Beispiele sind sehr passend, beinhalten zwei unterschiedliche Gründe, warum Fragestellungen komplex genug sein können, NNs zu bemühen. 1) hat viele, viele stetig zusammenhängende Eingaben (Position des Bots), bei denen kleine Unterschiede aber auch große Auswirkungen haben können (steht der Bot oben oder unten an einer Kante?). Eine vollständige Auflistung aller Situationen ist weder praktikabel noch sinnvoll. 2) hat dagegen diskrete, gut unterscheidbare Eingaben (A mag was, was B eben nicht mag). Die Anzahl der Situation steigt multiplikativ mit Anzahl Leute und Anzahl Güter. Sind diese zu klein, lohnt sich ein NN nicht.
Es gibt noch eine dritte Art von Lernaufgaben, z.B. mit einer Tennisball-Wurfanlage im Freien in einen Eimer treffen. Hier entsteht durch Wind eine Unsicherheit (Rauschen), so dass selbst bei gleichen Eingaben (Einstellungen der Maschine) unterschiedliche Ergebnisse erzielt werden. Die Komplexität der Aufgabe ist also durch das Rauschen erhöht. Mischformen sind natürlich üblich.
Ich schicke mal den Text ab und schreibe weiter.