Kurzusleírás
Bevezetés
- A Spark és Hadoop jellemzőinek és architektúrájának áttekintése
- A big data megértése
- Python programozás alapjai
Bevezetés
- Python, Spark és Hadoop beállítása
- Adatszerkezetek megértése Pythonban
- A PySpark API megértése
- A HDFS és MapReduce megértése
Spark és Hadoop integrálása Pythonnal
- Spark RDD implementálása Pythonban
- Adatok feldolgozása MapReduce segítségével
- Elosztott adathalmazok létrehozása HDFS-ben
Gépi tanulás Spark MLlib segítségével
Big Data feldolgozás Spark Streaminggel
Ajánlórendszerek használata
Kafka, Sqoop, Kafka és Flume használata
Apache Mahout Sparkkal és Hadoopmal
Hibaelhárítás
Összefoglalás és következő lépések
Követelmények
- Tapasztalat Spark és Hadoop használatában
- Python programozási tapasztalat
Célközönség
- Adattudósok
- Fejlesztők
Vélemények (3)
Az, hogy a legtöbb információt, tananyagot, prezentációt és gyakorlatokat elvitthettük magunkkal, így vissza tudjuk nézni őket, és újból átnézhetjük az elsőre nem teljesen megértettekét vagy javíthatjuk a már készítetteinket.
Raul Mihail Rat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
Szerettek, hogy sikeresen megfektette a téma alapjait és eljutott néhány összetettabb feladatra. Ezen kívül könnyen írható és tesztelhető kód megoldásokat is kínált.
Ionut Goga - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás