Adatelőkészítés és -feldolgozás

Oktatási cél: A tantárgy célja, hogy a hallgatók megismerjék az adatelőkészítési, -előfeldolgozási és
adattranszformációs feladatok célját, módszereit, szükségességének okait az adatmodellek
és adatkiértékelési folyamatok megfelelő működéséhez. A tárgy további célja az adatok
gyűjtési, tárolási és betöltési kérdéseinek elemzése is.
Az előadásokon bemutatott módszerek elméleti megközelítése és az adatelőkészítés
gyakorlati jelentőségének ismertetése után a gyakorlatokon a hallgatók ezek Python
programozási nyelven történő implementációját sajátíthatják el.

Tematika: A tárgy tematikája az adatok előfeldolgozásának négy fő lépése (adattisztítás,
adattranszformáció, adatintegráció, és adatredukció) köré rendezve a következő témákat
foglalja magába: CRISP-DM, adatok betöltése, adatok megismerése, hiányzó adatok,
outlierek kezelése, adatmanipuláció, adattranszformáció, normalizálás, aggregáció,
dimenziócsökkentés/-növelés, adattömörítés, diszkretizálás, adatminőség-biztosítás,
valamint ezen feladatok megvalósításához használható eszközök ismertetése.

Adatelőkészítés és -feldolgozás