Reinforcement Learning oder “verstärkendes Lernen” gilt als Alternative zum unsupervised learning (nicht überwachtes Lernen) und steht für eine Reihe von Methoden des maschinellen Lernens. Der Begriff ist der Psychologie entlehnt und wurde bereits seit den Anfängen der Kybernetik verwendet. So benutzte schon der KI Pionier Marvin Minsky den Begriff in seiner Dissertation von 1954.
Die Modelle des bestärkenden Lernens versuchen das Lernverhalten in der Natur nachzubilden. Gute Ergebnisse werden durch Belohnung gefördert, schlechte bestraft (mittels Trial and Error). Eine künstliche Intelligenz soll also selbst lernen, Lösungswege zu finden und sich eigenständig verbessern. Als besonders spektakulärer Case für den Einsatz von reinforcement learning gilt der Sieg von google DeepMinds Sieg im Spiel AlphaGo über Lee Sedol.