Kurzusleírás
Bevezetés
Adatelérési módszerek áttekintése (Hive, adatbázisok stb.)
A Spark jellemzőinek és architektúrájának áttekintése
A Spark telepítése és konfigurálása
Az adatkeretek (Dataframes) megértése a Sparkban
Táblák definiálása és adathalmazok importálása
Adatkeretek lekérdezése SQL segítségével
Aggregációk, JOIN-ok és beágyazott lekérdezések végrehajtása
Adatok feltöltése és elérése
Különböző típusú adatok lekérdezése
- JSON, Parquet stb.
Adattavak lekérdezése SQL segítségével
Hibaelhárítás
Összefoglalás és befejezés
Követelmények
- Tapasztalat SQL lekérdezésekben
- Programozási tapasztalat bármilyen nyelven
Célközönség
- Adatelemzők
- Adattudósok
- Adatmérnökök
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Elegendő gyakorlati tanulási lehetőség, a képző tudatosan elismétli a fontos pontokat.
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Gépi fordítás
Megismerheti a Spark Streaming-et, a Databricks-ot és az AWS Redshiftet.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurzus - Apache Spark in the Cloud
Gépi fordítás
gyakorló feladatok
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurzus - Python and Spark for Big Data (PySpark)
Gépi fordítás