inf-schule | Anpassung der Q-Werte

Implementation

Aufgabe 1: Neu-Implementation der Funktion `lerne_dazu`

Schreibe die Funktion lerne_dazu so um, dass sie den Überlegungen aus dem letzten Abschnitt entspricht. Nutze hierfür die bereits implementierte Funktion beste_aktion. Bedenke dabei, dass es vorkommen kann, dass in der Folgesituation gar keine Aktionen mehr möglich sind, dass also die Liste naechste_moegliche_aktionen leer ist. Dieser Fall muss dann gesondert behandelt werden, wie im letzten Abschnitt beschrieben.

Aufgabe 2: Test des Lernalgorithmus `lerne_dazu`

Starte das Programm spiel_ki.py und drücke den Knopf "Lernen". Warte solange, bis mehrfach der Safe geöffnet wurde. Brich dann den Lernvorgang mit "Stop" ab und überprüfe mit dem Knopf "Spiele optimal", ob der Agent gelernt hat, das Spiel optimal zu spielen.

Implementation

Aufgabe 1: Neu-Implementation der Funktion lerne_dazu

Aufgabe 2: Test des Lernalgorithmus lerne_dazu

Suche

Rückmeldung geben

Aufgabe 1: Neu-Implementation der Funktion `lerne_dazu`

Aufgabe 2: Test des Lernalgorithmus `lerne_dazu`