Kurzusleírás
Bevezetés
- A Spark és Hadoop szolgáltatásainak és architektúrájának áttekintése
- A big data megértése
- Python programozási alapismeretek
Elkezdeni
- Beállítás Python, Spark és Hadoop
- Az adatszerkezetek megértése a Python-ben
- A PySpark API megértése
- A HDFS és a MapReduce megértése
A Spark és az Hadoop integrálása a Python-gyel
- A Spark RDD megvalósítása a Python-ben
- Adatfeldolgozás a MapReduce segítségével
- Elosztott adatkészletek létrehozása HDFS-ben
Machine Learning Spark MLlib-el
Big Data feldolgozása Spark Streaming-vel
Recommender Systems használata
Együttműködés Kafkával, Sqooppal, Kafkával és Flume-mal
Apache Mahout Sparkkal és Hadoop
Hibaelhárítás
Összegzés és a következő lépések
Követelmények
- Tapasztalat a Sparkban és Hadoop
- Python programozási tapasztalat
Közönség
- Adattudósok
- Fejlesztők
Vélemények (3)
Az, hogy a legtöbb információt, tananyagot, prezentációt és gyakorlatokat elvitthettük magunkkal, így vissza tudjuk nézni őket, és újból átnézhetjük az elsőre nem teljesen megértettekét vagy javíthatjuk a már készítetteinket.
Raul Mihail Rat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
Szerettek, hogy sikeresen megfektette a téma alapjait és eljutott néhány összetettabb feladatra. Ezen kívül könnyen írható és tesztelhető kód megoldásokat is kínált.
Ionut Goga - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás