Programming for Corpus Linguistics with Python and Dataframes
Produktbeskrivelse
Dette elementet retter seg mot mellomliggende og erfarne programmerere som søker algoritmer for korpuslingvistikk (CL) programmering i Python, med bruk av dataframes. Dataframes gir en rask, effektiv og intuitiv tilnærming til håndtering av store og komplekse datasett, slik som korpora. I denne boken vises prinsipper for programmering med dataframes anvendt på CL-analyser, samt komplette algoritmer for å lage koncordanser, produsere lister over kollokasjoner, nøkkelord og leksikalske bunter, samt utføre nøkkelfunksjonsanalyse. En ekstra algoritme for å lage dataframe-korpora presenteres, som inkluderer metoder for tokenisering, posisjonering (part-of-speech tagging) og lemmatisering ved hjelp av spaCy. Dette elementet tilbyr et sett av kjerneferdigheter som kan benyttes på et bredt spekter av CL-forskningsspørsmål, samt originale analyser som ikke kan utføres med eksisterende korpusprogramvare.