Oktatási cél: A tantárgy célja, hogy a hallgatók megismerjék az adatelőkészítési, előfeldolgozási és adattranszformációs feladatok célját, módszereit, szükségességének okait az adatmodellek és adatkiértékelési folyamatok megfelelő működéséhez. A tárgy további célja az adatok gyűjtési, tárolási és betöltési kérdéseinek elemzése is. Az előadásokon bemutatott módszerek elméleti megközelítése után a gyakorlatokon a hallgatók ezek Python programozási nyelven történő implementációját sajátíthatják el.
Tematika: A tárgy tematikája az adatok előfeldolgozásának négy fő lépése (adattisztítás, adattranszformáció, adatintegráció, és adatredukció) köré rendezve a következő témákat foglalja magába: CRISP-DM, adatok betöltése, adatok megismerése, hiányzó adatok, outlierek kezelése, adatmanipuláció, adattranszformáció, normalizálás, aggregáció, dimenzió csökkentés/növelés, adattömörítés, diszkretizálás, adatminőség biztosítás, valamint ezen feladatok megvalósításához használható eszközök ismertetése.