Oktatási cél: A tantárgy célja a hallgatók bevezetése a Big Data technológiák témakörébe
bemutatva ezen rendszerek elméleti és gyakorlati működését. Bemutatásra
kerül a nagy méretű adatállomány gyűjtésének, tárolásának, feldolgozásának,
vizualizációjának célja, folyamatai, lehetséges kivitelezései, háttere. A témákat
a hallgatók gyakorlatban is feldolgozzák előre telepített és a labor során saját
maguk által telepített, továbbá felhő technológián alapuló rendszerek
segítségével. Bemutatásra kerül több különböző Big Data keretrendszer és
adatfeldolgozó, adatvizualizáló és elemző technológia (Apache Hadoop, Spark,
Kafka, Databricks), így a hallgatók több megközelítésből megismerik és
elsajátítják az érintett témaköröket mind saját telepítésű, mind felhő alapú
rendszerekben.
Tematika: A kurzus elvégzése során a hallgatók megismerik a Big Data rendszerek
elméleti hátterét, a rendelkezésre álló, feldolgozatlan és nagy mennyiségű
adatok kezelésének problémakörét, ezen adatok begyűjtésének, tárolásának,
feldolgozásának és megjelenítésének folyamatait és lehetőségeit, analitikai
technológiákat, biztonsági és etikai kérdéseit. Az egyes témakörök bemutatják
a Big Data rendszerek ezen főbb folyamatait és gyakorlati megoldásokat
kínálnak azok megvalósításához.
A hallgatók gyakorlat során ma is használt adatfeldolgozási, tárolási,
megjelenítési és analitikai technológiát fognak használni a feladatok elvégzése
során, amik bemutatják a Big Data adatkezelés főbb folyamatait. Így
megismerhetnek Open Source és üzleti modellű rendszereket a gyakorlatban,
továbbá saját telepítésű és felhő alapú rendszerek használatát is elsajátíthatják.