Den betydelig utvidede og oppdaterte utgaven av en mye brukt tekst om forsterkningslæring, et av de mest aktive forskningsområdene innen kunstig intelligens. Forsterkningslæring er en datadrevet tilnærming til læring, der en agent søker å maksimere den totale belønningen den mottar mens den interagerer med et komplekst og usikkert miljø. I "Reinforcement Learning" gir Richard Sutton og Andrew Barto en klar og enkel fremstilling av feltets viktigste ideer og algoritmer. Denne andre utgaven er betydelig utvidet og oppdatert, og presenterer nye emner samt oppdateringer av eksisterende temaer. Som i første utgave fokuserer denne utgaven på kjernemateriale og online læringsalgoritmer, med mer matematiske emner plassert i skyggebokser. Del I dekker så mye av forsterkningslæring som mulig uten å gå utover det tabellariske tilfellet der eksakte løsninger kan finnes. Boken tilbyr en dyptgående analyse av mange algoritmer.