Kurzusleírás
Bevezetés
- A Spark és Hadoop szolgáltatásainak és architektúrájának áttekintése
- A big data megértése
- Python programozási alapismeretek
Elkezdeni
- Beállítás Python, Spark és Hadoop
- Az adatszerkezetek megértése a Python-ben
- A PySpark API megértése
- A HDFS és a MapReduce megértése
A Spark és az Hadoop integrálása a Python-gyel
- A Spark RDD megvalósítása a Python-ben
- Adatfeldolgozás a MapReduce segítségével
- Elosztott adatkészletek létrehozása HDFS-ben
Machine Learning Spark MLlib-el
Big Data feldolgozása Spark Streaming-vel
Recommender Systems használata
Együttműködés Kafkával, Sqooppal, Kafkával és Flume-mal
Apache Mahout Sparkkal és Hadoop
Hibaelhárítás
Összegzés és a következő lépések
Követelmények
- Tapasztalat a Sparkban és Hadoop
- Python programozási tapasztalat
Közönség
- Adattudósok
- Fejlesztők
Vélemények (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
The live examples