Bislang hat unser Computer zwar in Abhängigkeit der Situation
Entscheidungen getroffen, aber diese waren mehr oder weniger von der
Q-Tabelle geleitet, die mit "natürlicher Intelligenz" bzw. mit
"menschlichem Lernen" erstellt wurde.
In den folgenden Abschnitten soll nun die Q-Tabelle selbst als Ergebnis
eines maschinellen Lernens angepasst werden, also aufgrund von
Erfahrungen, die der Agent mit dem Spiel macht.