Kurzusleírás
Bevezetés
Adatelérési módszerek áttekintése (Hive, adatbázisok stb.)
A Spark jellemzőinek és architektúrájának áttekintése
A Spark telepítése és konfigurálása
Az adatkeretek (Dataframes) megértése a Sparkban
Táblák definiálása és adathalmazok importálása
Adatkeretek lekérdezése SQL segítségével
Aggregációk, JOIN-ok és beágyazott lekérdezések végrehajtása
Adatok feltöltése és elérése
Különböző típusú adatok lekérdezése
- JSON, Parquet stb.
Adattavak lekérdezése SQL segítségével
Hibaelhárítás
Összefoglalás és befejezés
Követelmények
- Tapasztalat SQL lekérdezésekben
- Programozási tapasztalat bármilyen nyelven
Célközönség
- Adatelemzők
- Adattudósok
- Adatmérnökök
Vélemények (3)
Szerettek, hogy gyakorlati volt. Örültem annak, hogy a teóriai ismereteket gyakorlati példákkal alkalmazhattam.
Aurelia-Adriana - Allianz Services Romania
Kurzus - Python and Spark for Big Data (PySpark)
Gépi fordítás
Az, hogy a legtöbb információt, tananyagot, prezentációt és gyakorlatokat elvitthettük magunkkal, így vissza tudjuk nézni őket, és újból átnézhetjük az elsőre nem teljesen megértettekét vagy javíthatjuk a már készítetteinket.
Raul Mihail Rat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás