Building and Using Comparable Corpora for Multilingual Natural Language Processing
Produktbeskrivelse
Boken «Building and Using Comparable Corpora for Multilingual Natural Language Processing» tilbyr en grundig oversikt over metodene for å bygge sammenlignbare korpus og deres anvendelser, som inkluderer maskinoversettelse, tverrspråklig overføring og diverse typer flerspråklig naturlig språkprosessering. Forfatterne innleder med en kort historikk om emnet, etterfulgt av en sammenligning med parallelle ressurser og en forklaring på hvorfor sammenlignbare korpus har blitt mer utbredt. I særdeleshet legger de grunnlaget for flerspråklige kapabiliteter i forhåndstrente modeller, som BERT eller GPT. Boken retter seg deretter mot oppbygning av sammenlignbare korpus, justering av setninger for å skape en database med passende oversettelser, og bruken av disse setningsoversettelsene til å produsere ordbøker og terminologidatabaser. Videre forklares det hvordan sammenlignbare korpus kan benyttes til å bygge maskinoversettelsesmotorer og utvikle et bredt spekter av flerspråklige applikasjoner.