Bestärkendes Lernen mit Q-Learning
Worum geht es?
Das Thema "Künstliche Intelligenz" ist in aller Munde. Besonders faszinierend sind dabei Computerprogramme, bei denen nicht einfach Aspekte menschlicher "Intelligenz" von einem Programmierer "einprogrammiert" wurden, sondern die in der Lage sind, aus Erfahrung mit ihrer Umgebnung selbst zu lernen.
Im Science-Fiction-Klassiker "WarGames - Kriegsspiele" aus dem Jahr 1983 spielt ein solches lernendes Computerprogramm eine Schlüsselrolle, das militärische Szenarien als Computerspiele betrachtet, die es versucht, immer besser zu spielen. Nur dass im Film Simulation und Wirklichkeit durcheinandergeraten ...
In diesem Abschnitt soll tatsächlich ein Computerprogramm schrittweise entwickelt werden, das tatsächlich in der Lage ist, ein einfaches Computer-Spiel immer besser zu spielen. Das verwendete Lernverfahren, das so genannte Q-Lernen, gehört zum so genannten "Bestärkenden Lernen" (engl. "Reinforcement Learning" ).
Das Q-Lernen beruht auf einer Tabelle von so genannten "Qualitätswerten" (daher das "Q"), die beim Lernen immer wieder angepasst wird und aus denen ein immer besseres Verhalten abgeleitet wird.