Boken 'Data Preprocessing in Data Mining' tar for seg en av de mest sentrale utfordringene innen prosessen kjent som Knowledge Discovery from Data. Data som hentes direkte fra kilder kan ofte inneholde inkonsekvenser, feil eller, viktigst av alt, være utilstrekkelige for å bli vurdert i en datamineringsprosess. Den stadig økende mengden data som genereres innen forskjellige vitenskapelige, industrielle og forretningsmessige applikasjoner, understreker behovet for mer komplekse verktøy for analyse. Gjennom dataforbehandling kan man gjøre det som før var umulig, mulig. Dette gjøres ved å tilpasse dataene slik at de oppfyller kravene til de ulike datamineringsalgoritmene. Dataforbehandling omfatter også teknikker for datanedring, som har som mål å redusere kompleksiteten i dataene samt å oppdage og fjerne irrelevante og støyende elementer. Denne boken gir en grundig gjennomgang av oppgavene som broar gapet mellom datainnsamling fra kilden og datamineringsprosessen, med et praktisk perspektiv og fokus på det grunnleggende.