Kurzusleírás

Bevezetés a Big Data ökoszisztémákba

  • Áttekintés a nagyadatok technológiáinak és architektúráinak
  • Csomagolásos feldolgozás versus valós idejű feldolgozás
  • Adattárolási stratégiák skálázhatóságra

Haladó adatok feldolgozása Apache Spark-el

  • Spark-jobok teljesítményoptimálása
  • Haladó átalakítások és akciók
  • Szerkesztett streameléssel való munkavégzés

Machine Learning nagyméretben

  • Elosztott modellképzési technikák
  • Hiperparaméterbeállítás nagy adathalmazokon
  • Modellbevezetés nagyadatos környezetekben

Deep Learning a Big Data számára

  • TensorFlow és PyTorch integrálása Sparkkel
  • Elosztott mélytanulási képzési pipeline-ök
  • Alkalmazási példák kép, szöveg és idősorozat-analízisben

Valós idejű analitika és adatok streamelése

  • Apache Kafka streamelt adatok beviteléhez
  • Streamelt feldolgozási keretrendszerek
  • Monitorozás és értesítés valós idejű rendszerekben

Data Governance, biztonság és etika

  • Adatvédelem és követelmények
  • Access ellenőrzés és titkosítás nagyadatos rendszerekben
  • Etikai szempontok nagyméretű analitika esetében

Big Data integrálása Business Intelligence-vel

  • Adatvizualizáció és táblázatok nagyadatokhoz
  • Nagyadatos pipeline-ok csatolása BI eszközökhöz
  • Haladó analitika segítségével üzleti eredmények elérése

Összegzés és következő lépések

Követelmények

  • Adatanalízis és statisztikai modellkészítés alapos ismerete
  • Python, R, vagy Scala adatfeldolgozó eszközök és programozási nyelvek tapasztalata
  • Hadoop vagy Spark eloszlási számítástechnikai keretek ismerete

Célközönség

  • Adat tudósok, akik a nagy méretű adatfeldolgozás és előrejelző analitika mesterei szeretnének lenni
  • Szakértők, akik a fejlett analitikai folyamatok tervezése és megvalósítása érdekében keresik a továbbképzést
  • Kutatás-fejlesztési szakemberek, akik innovatív adatalapú megoldásokra koncentrálnak
 42 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák