Lag ditt eget treningskorpus for naturlig språkbehandling innen maskinlæring. Denne eksemplardrevne boken tar deg gjennom annoteringssyklusen, fra valg av annoteringsoppgave og oppretting av annoteringsspesifikasjon, til utforming av retningslinjer og opprettelse av et 'gullstandard' korpus. Deretter får du innsikt i den faktiske dataskapingsprosessen gjennom annoteringsarbeidet. Selv om det finnes systemer for å analysere eksisterende korpus, kan det å lage et nytt korpus være svært komplekst. For å hjelpe deg med å bygge et solid grunnlag for dine egne mål innen maskinlæring, inkluderer denne brukervennlige guiden flere casestudier som demonstrerer fire forskjellige annoteringsoppgaver i detalj. Du vil også lære hvordan du kan bruke en lettvekts programvare for annotering av tekster og for å vurdere annotasjonene. Denne boken er en perfekt følge til O'Reillys 'Natural Language Processing with Python', som beskriver hvordan man bruker eksisterende korpus med Natural Language Toolkit.