Bevezetés az adattudományba

Oktatási cél: az adattudomány alapfogalmainak és folyamatainak gyakorlati megközelítésű megismertetése. A
hallgatók a gyakorlati életből vett valós alkalmazási példákon keresztül az ismereteket megtapasztalva, egyre
mélyebbre haladva precíz elméleti és egyúttal praktikus gyakorlati ismeretekhez jutnak. Az elméleti ismeretek
gerincét a gépi tanulás algoritmusai adják, a gyakorlati feladatok pedig az elmélet gyakorlati megjelenítését
szolgálják Python nyelv használatán keresztül.

Tematika: Történet, példák, esettanulmányok, az adattudományba sorolható területek. Statisztika alapok. CRISP
DM és a 6 fázisa. Adattisztítás. Felügyelt, felügyelet nélküli és megerősítéses tanulás. Túltanulás, alultanulás.
Modellek validálása, tanulási/validációs/tesztelési halmaz, keresztvalidáció, Bias-Variance, Precision-Recall, F1-
score ROC görbe, AUC. Legkisebb négyzetek módszere. Lineáris Regresszió. Logisztikus regresszió. SVM.
Neurális hálók. Döntési fák. Véletlen erdők. Boosting. Felügyelet nélküli tanulás. Klaszterezés. K-means
klaszterezés. Megerősítéses tanulás. Nagyobb esettanulmányok, kitekintés. Az adatmanipulálás, prediktív analízis,
megjelenítés lépései valódi adatokkal elsősorban Python-csomagok (pandas, scikit-learn, matplotlib, ggplot)
használatával.

https://nik.uni-obuda.hu/targyleirasok/wp-content/uploads/2022/07/Bevezet%C3%A9s-az-adattudom%C3%A1nyba_HU_MI_sablon_v2_FR.pdf