Oppdag hvordan du kan bruke, implementere og vedlikeholde Apache Spark med denne omfattende guiden, skrevet av skaperne av den åpne kildekode-løsningen for klyngecomputing. Med et spesielt fokus på forbedringer og nye funksjoner i Spark 2.0, deler forfatterne Bill Chambers og Matei Zaharia opp temaene i separate seksjoner med unike mål. Du vil lære om grunnleggende operasjoner og vanlige funksjoner i Sparks strukturerte API-er, samt få innsikt i Structured Streaming, en ny høy-nivå API for å bygge end-to-end streaming-applikasjoner. Utviklere og systemadministratorer vil få en solid forståelse av monitoring, tuning og feilsøking av Spark, samt utforske maskinlæringsteknikker og scenarier for bruk av MLlib, Sparks skalerbare maskinlæringsbibliotek. Få en myk introduksjon til big data og Spark, lær om DataFrames, SQL, og Datasets – Sparks kjernetechnologier – gjennom praktiske eksempler. Dyk inn i Sparks lav-nivå API-er, RDD-er, og utførelsen av SQL og DataFrames. Forstå hvordan Spark opererer på en klynge og mestre debugging, noe som vil styrke dine ferdigheter i denne kraftige plattformen.