Kurzusleírás

Bevezetés

  • A Spark és Hadoop szolgáltatásainak és architektúrájának áttekintése
  • A big data megértése
  • Python programozási alapismeretek

Elkezdeni

  • Beállítás Python, Spark és Hadoop
  • Az adatszerkezetek megértése a Python-ben
  • A PySpark API megértése
  • A HDFS és a MapReduce megértése

A Spark és az Hadoop integrálása a Python-gyel

  • A Spark RDD megvalósítása a Python-ben
  • Adatfeldolgozás a MapReduce segítségével
  • Elosztott adatkészletek létrehozása HDFS-ben

Machine Learning Spark MLlib-el

Big Data feldolgozása Spark Streaming-vel

Recommender Systems használata

Együttműködés Kafkával, Sqooppal, Kafkával és Flume-mal

Apache Mahout Sparkkal és Hadoop

Hibaelhárítás

Összegzés és a következő lépések

Követelmények

  • Spark és Hadoop használatában szerzett tapasztalat
  • Python programozási tapasztalat

Közönség

  • Adattudósok
  • Fejlesztők
 21 Hours

Résztvevők száma



Ár per résztvevő

Vélemények (3)

Rokon tanfolyam

Rokon kategóriák