Lær hvordan du bygger skalerbare maskinløsninger fra ende til ende ved hjelp av Apache Spark. I denne praktiske guiden introduserer forfatteren Adi Polak data- og maskinlæringsutøvere for innovative løsninger som overgår dagens tradisjonelle metoder. Du vil oppdage en mer helhetlig tilnærming som lar deg gå utover spesifikke krav og organisasjonsmål, noe som forbedrer samarbeidet mellom data- og maskinlæringsutøvere. Boken "Scaling Machine Learning with Spark" undersøker flere teknologier for å utvikle distribuerte arbeidsflyter for maskinlæring basert på Apache Spark-økosystemet, inkludert Spark MLlib, MLflow, TensorFlow og PyTorch. Hvis du er en dataspecialist som arbeider med maskinlæring, viser denne boken deg når og hvorfor du bør bruke hver teknologi. Du vil: Utforske maskinlæring, inkludert begreper og terminologi for distribuerte databehandling; Håndtere ML-livssyklusen med MLflow; Ingestere data og utføre grunnleggende forbehandling med Spark; Utforske funksjonsingeniørkunst og bruke Spark til å ekstrahere funksjoner.