Kurzusleírás

Bevezetés

  • A Spark és Hadoop jellemzőinek és architektúrájának áttekintése
  • A big data megértése
  • Python programozás alapjai

Bevezetés

  • Python, Spark és Hadoop beállítása
  • Adatszerkezetek megértése Pythonban
  • A PySpark API megértése
  • A HDFS és MapReduce megértése

Spark és Hadoop integrálása Pythonnal

  • Spark RDD implementálása Pythonban
  • Adatok feldolgozása MapReduce segítségével
  • Elosztott adathalmazok létrehozása HDFS-ben

Gépi tanulás Spark MLlib segítségével

Big Data feldolgozás Spark Streaminggel

Ajánlórendszerek használata

Kafka, Sqoop, Kafka és Flume használata

Apache Mahout Sparkkal és Hadoopmal

Hibaelhárítás

Összefoglalás és következő lépések

Követelmények

  • Tapasztalat Spark és Hadoop használatában
  • Python programozási tapasztalat

Célközönség

  • Adattudósok
  • Fejlesztők
 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (3)

Közelgő kurzusok

Rokon kategóriák