Denne boken inneholder mer enn 90 praktiske oppskrifter som gir deg muligheten til å utføre lynraske analyser med Apache Spark. Her får du erfaring med hvordan du kan bruke Apache Spark til databehandling ved hjelp av konkrete oppskrifter. Du vil lære å implementere omfattende, storskala dataanalyser på en mer effektiv måte enn noensinne. I tillegg vil du jobbe med kraftige biblioteker som MLLib, SciPy, NumPy og Pandas for å trekke ut verdifull innsikt fra dataene dine. Boken retter seg mot både nybegynnere og mellomliggende datafagfolk samt dataanalytikere som ønsker å løse datarelaterte utfordringer ved hjelp av et distribuert databehandlingssystem. Det forventes at leserne har grunnleggende erfaring med oppgaver innen datavitenskap. Profesjonelle innen datavitenskap som ønsker å styrke sine ferdigheter og oppnå en fordel i feltet, vil finne stor verdi i denne boken. Du vil lære om emner innen datagruvedrift, tekstgruvet, naturlig språkprosessering, informasjonsinnhenting og maskinlæring. Boken gir deg verktøyene for å løse virkelige analytiske problemer med store datasett, og utfordringer innen datavitenskap vil bli adressert med analytiske verktøy på et distribuert system.