Data pipelines utgjør grunnlaget for suksess innen dataanalyse. De sørger for at data fra mange ulike kilder blir flyttet og transformert til en form som gir mening, noe som er avgjørende for å kunne hente ut ekte verdi fra dataene. I denne praktiske håndboken defineres hva data pipelines er, og hvordan de fungerer innenfor dagens moderne datainfrastruktur. Du vil bli kjent med viktige hensyn og beslutningspunkter når du implementerer pipelines, som for eksempel valget mellom batch- og streamingdata. Boken tar for seg de vanligste beslutningene faget dataanalytikere står overfor, og diskuterer grunnleggende konsepter som gjelder både for åpne kildekode-løsninger, kommersielle produkter og interne løsninger. Du vil lære om: hva en data pipeline er og hvordan den fungerer; hvordan data flyttes og behandles på moderne dataplattformer, inkludert skybaserte løsninger; vanlige verktøy og produkter som dataingeniører bruker for å bygge pipelines; hvordan pipelines støtter behovene innen analyse og rapportering; og viktige hensyn vedlikehold, testing, og varsling av pipelines.