Oktatási cél: A tantárgy célja a hallgatók bevezetése a Big Data technológiák
témakörébe bemutatva ezen rendszerek elméleti és gyakorlati
működését. Bemutatásra kerül a nagy méretű adatállomány
gyűjtésének, tárolásának, feldolgozásának, vizualizációjának célja,
folyamatai, lehetséges kivitelezései, háttere. A témákat a hallgatók
gyakorlatban is feldolgozzák előre telepített és a labor során saját
maguk által telepített, továbbá felhő technológián alapuló
rendszerek segítségével. Bemutatásra kerül több különböző Big
Data keretrendszer és adatfeldolgozó, adatvizualizáló és elemző
technológia (Apache Hadoop, Spark, Kafka, Databricks), így a
hallgatók több megközelítésből megismerik és elsajátítják az
érintett témaköröket mind saját telepítésű, mind felhő alapú
rendszerekben.
Tematika: A kurzus elvégzése során a hallgatók megismerik a Big Data
rendszerek elméleti hátterét, a rendelkezésre álló, feldolgozatlan és
nagy mennyiségű adatok kezelésének problémakörét, ezen adatok
begyűjtésének, tárolásának, feldolgozásának és megjelenítésének
folyamatait és lehetőségeit, analitikai technológiákat, biztonsági és
etikai kérdéseit. Az egyes témakörök bemutatják a Big Data
rendszerek ezen főbb folyamatait és gyakorlati megoldásokat
kínálnak azok megvalósításához.
A hallgatók gyakorlat során ma is használt adatfeldolgozási,
tárolási, megjelenítési és analitikai technológiát fognak használni
a feladatok elvégzése során, amik bemutatják a Big Data
adatkezelés főbb folyamatait. Így megismerhetnek Open Source és
üzleti modellű rendszereket a gyakorlatban, továbbá saját
telepítésű és felhő alapú rendszerek használatát is elsajátíthatják.