Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Bevezetés:
- Apache Spark in Hadoop Ökoszisztéma
- Rövid bevezető a python-hoz, scala-hoz
Alapok (elmélet):
- Építészet
- RDD
- Átalakulás és cselekvések
- Színpad, feladat, függőségek
A Databricks környezet használatával ismerje meg az alapokat (gyakorlati műhely):
- Gyakorlatok RDD API használatával
- Alapvető cselekvési és transzformációs függvények
- PárRDD
- Csatlakozik
- Gyorsítótárazási stratégiák
- Gyakorlatok a DataFrame API használatával
- SparkSQL
- DataFrame: kijelölés, szűrés, csoportosítás, rendezés
- UDF (felhasználó által meghatározott függvény)
- A DataSet API vizsgálata
- Folyó
Az AWS környezet használatával ismerje meg a telepítést (gyakorlati műhely):
- Az AWS ragasztó alapjai
- Ismerje meg az AWS EMR és az AWS ragasztó közötti különbségeket
- Példamunkák mindkét környezetben
- Értse meg az előnyöket és hátrányokat
Külön:
- Bevezetés a Apache Airflow hangszerelésbe
Követelmények
Programozási ismeretek (lehetőleg python, scala)
SQL alapok
21 Órák
Vélemények (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Kurzus - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
Kurzus - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift