Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kurzusleírás
Bevezetés:
- Apache Spark in Hadoop Ökoszisztéma
- Rövid bevezető a python-hoz, scala-hoz
Alapok (elmélet):
- Építészet
- RDD
- Átalakulás és cselekvések
- Színpad, feladat, függőségek
A Databricks környezet használatával ismerje meg az alapokat (gyakorlati műhely):
- Gyakorlatok RDD API használatával
- Alapvető cselekvési és transzformációs függvények
- PárRDD
- Csatlakozik
- Gyorsítótárazási stratégiák
- Gyakorlatok a DataFrame API használatával
- SparkSQL
- DataFrame: kijelölés, szűrés, csoportosítás, rendezés
- UDF (felhasználó által meghatározott függvény)
- A DataSet API vizsgálata
- Folyó
Az AWS környezet használatával ismerje meg a telepítést (gyakorlati műhely):
- Az AWS ragasztó alapjai
- Ismerje meg az AWS EMR és az AWS ragasztó közötti különbségeket
- Példamunkák mindkét környezetben
- Értse meg az előnyöket és hátrányokat
Külön:
- Bevezetés a Apache Airflow hangszerelésbe
Követelmények
Programozási ismeretek (lehetőleg python, scala)
SQL alapok
21 Hours
Vélemények (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Kurzus - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Kurzus - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift