I boken "Text as Data" presenterer forfatterne en grundig veiledning til bruk av datadrevet tekstanalyse for å utforske og forstå den sosiale verden. Med et mangfold av tekstkilder – fra sosial medieinnlegg og tekstmeldinger til digitale regjeringsdokumenter og arkiv – står forskere overfor en overflod av informasjon som avspeiler samfunnets kompleksitet. Denne tekstlige datamengden gir enestående muligheter til å belyse grunnleggende spørsmål innen samfunnsvitenskap, humaniora og næringsliv. I takt med at nye maskinlæringsteknologier utvikler seg raskt, omformer de måten vitenskap og næringsliv opererer på. "Text as Data" illustrerer hvordan man kan integrere innovative datakilder, maskinlæringsverktøy og forskningsdesign fra samfunnsvitenskapene for å utvikle og evaluere nye innsikter. Boken er strukturert rundt sentrale oppgaver i forskningsprosjekter som benytter tekst: representasjon, oppdagelse, måling, prediksjon og årsakssammenhenger. Forfatterne legger vekt på en sekvensiell, iterativ og induktiv tilnærming til forskningsdesign. Hver forskningsoppgave presenteres med virkelige anvendelser, eksempler på metoder og en distinkt oppgavefokusert forskningsstil.