Dyp forsterkningslæring har fått betydelig oppmerksomhet den siste tiden. Imponerende resultater har blitt oppnådd innen en rekke ulike områder som autonom kjøring, spill, molekylær rekombinasjon og robotikk. I disse feltene har dataprogrammer lært seg å forstå problemer som tidligere ble ansett som svært krevende. I spillet Go har programmet AlphaGo til og med klart å overvinne tre av verdens beste spillere. Dyp forsterkningslæring henter sin inspirasjon fra både biologi og psykologi. Innen biologi har man utviklet kunstige nevrale nettverk og dyp læring, mens psykologi undersøker hvordan dyr og mennesker lærer, samt hvordan ønsket atferd kan forsterkes gjennom både positive og negative stimuli. Når vi observerer hvordan forsterkningslæring lærer en simulert robot å gå, blir vi minnet om hvordan barn lærer seg nye ferdigheter gjennom lek og utforskning. Teknikker som er inspirert av biologi og psykologi viser seg å ha en enestående effektivitet i disse anvendelsene.