Boken "SQL for Data Science" av Antonio Badia er en praktisk innføring i SQL med fokus på bruken innen datavitenskap. Den tar for seg de ulike delene av SQL som er nødvendige for oppgavene som vanligvis utføres under dataanalyse. Gjennom et rammeverk som beskriver datalivssyklusen, setter boken søkelyset på trinn som ofte får mindre oppmerksomhet i tradisjonelle lærebøker, som datalasting, rengjøring og forbehandling. Den første delen i boken definerer datalivssyklusen, som omhandler rekkefølgen av faser fra datainnhenting til arkivering, og beskriver aktivitetene som finner sted i hver fase. I kapittel 2 dykker forfatteren inn i databaser og forklarer hvordan relasjonsdatabaser organiserer informasjon. Uvanlige datatyper som XML og tekst blir også omtalt. Kapittel 3 introduserer SQL-spørringer, men i motsetning til tradisjonelle lærebøker, belyses spørringer og deres komponenter gjennom typiske oppgaver innen dataanalyse, som datautforskning, rengjøring og transformasjon. Denne fokuserte tilnærmingen gjør boken til et verdifullt verktøy for alle som ønsker å styrke sine ferdigheter innen SQL og datavitenskap.