Analysér store mengder data på rekordtid med Apache Spark ved hjelp av Databricks i skyen. I denne boken vil du lære grunnleggende prinsipper og mer om hvordan man kjører analyser på store klynger i Azure og AWS ved bruk av Apache Spark sammen med Databricks. Oppdag hvordan du kan hente maks verdi ut av dataene dine til en brøkdel av kostnadene sammenlignet med tradisjonelle analytiske løsninger, samtidig som du får resultatene du trenger, raskere enn noensinne. Boken forklarer hvordan sammensmeltingen av disse sentrale teknologiene gir deg enorm kraft til arbeide med store dataset, og til en lav pris. Du begynner med å lære hvordan skyinfrastruktur muliggjør skalering av koden din til store mengder behandlingsenheter, uten at du trenger å betale for maskinen på forhånd. Deretter vil du lære hvordan Apache Spark, et rammeverk med åpen kildekode, kan gjøre alle disse prosessorene tilgjengelige for dataanalyse. Til slutt vil du se hvordan tjenester som Databricks gir deg kraften fra Apache Spark, uten at du trenger å ha omfattende forhåndskunnskaper.