Aufgabe 1: Neu-Implementation der Funktion
lerne_dazu
Schreibe die Funktion lerne_dazu so um, dass sie den
Überlegungen aus dem letzten Abschnitt entspricht. Nutze hierfür die
bereits implementierte Funktion beste_aktion. Bedenke
dabei, dass es vorkommen kann, dass in der Folgesituation gar keine
Aktionen mehr möglich sind, dass also die Liste
naechste_moegliche_aktionen leer ist. Dieser Fall muss
dann gesondert behandelt werden, wie im letzten Abschnitt beschrieben.
Aufgabe 2: Test des Lernalgorithmus
lerne_dazu
Starte das Programm spiel_ki.py und drücke den Knopf
"Lernen". Warte solange, bis mehrfach der Safe geöffnet wurde. Brich
dann den Lernvorgang mit "Stop" ab und überprüfe mit dem Knopf "Spiele
optimal", ob der Agent gelernt hat, das Spiel optimal zu spielen.