Apache Spark er en kraftig teknologi når alt fungerer som det skal. Men hvis du opplever at ytelsesforbedringene ikke er som forventet, eller hvis du fortsatt ikke føler deg trygg nok til å bruke Spark i produksjon, er denne praktiske boken skrevet for deg. Forfatterne Holden Karau og Rachel Warren gir en grundig innføring i ytelsesoptimaliseringer som hjelper deg med å få Spark-spørringene til å kjøre raskere, håndtere større datamengder og bruke færre ressurser. Boken er ideell for programvareingeniører, dataingeniører, utviklere og systemadministratorer som arbeider med datasystemer i stor skala. Den beskriver teknikker som kan redusere kostnadene for datainfrastruktur og utviklingstid. Ved å lese denne boken vil du ikke bare oppnå en mer omfattende forståelse av Spark, men også lære hvordan du kan få teknologien til å yte sitt beste. Innholdet inkluderer: Hvordan Spar SQLs nye grensesnitt forbedrer ytelsen sammenlignet med SQLs RDD-datastruktur, valget mellom datakoblinger i Core Spark og Spark SQL, teknikker for å utnytte standard RDD-transformasjoner maksimalt samt metoder for å omgå ytelsesproblemer.