Adatelőkészítés és -feldolgozás

Oktatási cél:
A tantárgy célja, hogy a hallgatók megismerjék az adatelőkészítési, -előfeldolgozási és adattranszformációs feladatok célját, módszereit, szükségességének okait az adatmodellek és adatkiértékelési folyamatok megfelelő működéséhez. A tárgy további célja az adatok gyűjtési, tárolási és betöltési kérdéseinek elemzése is.
Az előadásokon bemutatott módszerek elméleti megközelítése és az adatelőkészítés gyakorlati jelentőségének ismertetése után a gyakorlatokon a hallgatók ezek Python programozási nyelven történő implementációját sajátíthatják el.

Tematika:
A tárgy tematikája az adatok előfeldolgozásának négy fő lépése (adattisztítás, adattranszformáció, adatintegráció, és adatredukció) köré rendezve a következő témákat foglalja magába: CRISP-DM, adatok betöltése, adatok megismerése, hiányzó adatok, outlierek kezelése, adatmanipuláció, adattranszformáció, normalizálás, aggregáció, dimenziócsökkentés/-növelés, adattömörítés, diszkretizálás, adatminőség-biztosítás, valamint ezen feladatok megvalósításához használható eszközök ismertetése.

Adatelőkészítés és -feldolgozás