Boken 'Efficient Processing of Deep Neural Networks' gir en grundig behandling av de sentrale prinsippene og teknikkene som muliggjør effektiv prosessering av dype nevrale nettverk (DNNs). DNN-er er i dag mye brukt innen mange applikasjoner for kunstig intelligens, inkludert datamaskinsyn, talekjennelse og robotikk. Selv om DNN-er oppnår fremragende nøyaktighet innen mange AI-oppgaver, medfører dette høy beregningsmessig kompleksitet. For å muliggjøre bred distribusjon av DNN-er i AI-systemer, er det derfor avgjørende å utvikle teknikker som forbedrer nøkkelmetrikker—som energieffektivitet, gjennomstrømning og latens—uten å gå på bekostning av nøyaktighet eller øke maskinvarekostnadene. Boken omfatter bakgrunnsinformasjon om DNN-prosessering; en beskrivelse og taksonomi av maskinvarearkitektoniske tilnærminger for design av DNN-akseleratorer; samt viktige metrikker for evaluering og sammenligning av ulike design. Den diskuterer også funksjoner ved DNN-prosessering som kan utformes gjennom samarbeid mellom maskinvare og algoritmer for å forbedre energieffektiviteten.