Kurzusleírás
Bevezetés
- A Spark és Hadoop szolgáltatásainak és architektúrájának áttekintése
- A big data megértése
- Python programozási alapismeretek
Elkezdeni
- Beállítás Python, Spark és Hadoop
- Az adatszerkezetek megértése a Python-ben
- A PySpark API megértése
- A HDFS és a MapReduce megértése
A Spark és az Hadoop integrálása a Python-gyel
- A Spark RDD megvalósítása a Python-ben
- Adatfeldolgozás a MapReduce segítségével
- Elosztott adatkészletek létrehozása HDFS-ben
Machine Learning Spark MLlib-el
Big Data feldolgozása Spark Streaming-vel
Recommender Systems használata
Együttműködés Kafkával, Sqooppal, Kafkával és Flume-mal
Apache Mahout Sparkkal és Hadoop
Hibaelhárítás
Összegzés és a következő lépések
Követelmények
- Tapasztalat a Sparkban és Hadoop
- Python programozási tapasztalat
Közönség
- Adattudósok
- Fejlesztők
Vélemények (3)
Azt, hogy tudtuk elvinnük a legtöbb információt/kurzust/előadást/gyakorlatot, így át tudjuk nézni őket, és talán újra megcsináljuk azokat, amit először nem értettünk meg, vagy javítunk azon, amit már megcsináltunk.
Raul Mihail Rat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
I tetszett, hogy alapokat raktár a témára, és némi fejlettebb gyakorlatokat is tartalmazott. Emellett könnyű módszereket is nyújtott a kód írásához/vizsgálatához.
Ionut Goga - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás