Kurzusleírás

Bevezetés a Stratio Platformba

  • Áttekintés a Stratio architektúrájáról és alapvető modulairól
  • A Rocket és Intelligence szerepe az adatok életciklusában
  • Bejelentkezés és a Stratio UI navigálása

Munka a Rocket Modullal

  • Adatbefogadás és pipeline létrehozása
  • Adatforrások kapcsolódtatása és transzformációk konfigurálása
  • PySpark használata előfeldolgozási feladatokhoz a Rocketben

PySpark alapjai a Stratio felhasználóknak

  • PySpark adatszerkezetek és műveletek
  • Ciklusok: for, while, if/else használata
  • Def használata és saját függvények írása

Rocket előrehaladott használata PySpark-kal

  • Streaming adatbefogadás és transzformációk
  • Ciklusok és függvények használata batch és real-time scenariókban
  • Legjobb gyakorlatok a PySpark teljesítményéért pipeline-okban

A Intelligence Modul felfedezése

  • Áttekintés az adatmodellezési és analitikai funkciókról
  • Jellemzők kiválasztása, transzformálása és felfedezése
  • PySpark szerepe az egyedi analitika és insightokban

Összetett analitikai folyamatok létrehozása

  • Egyedi felhasználói függvények (UDFs) létrehozása Intelligence-ben
  • Feltételek és ciklusok alkalmazása az adatlogikához
  • Használati esetek: szegmentáció, aggregáció és előrejelzés

Telepítés és Collaboration

  • Munkafolyamatok mentése, exportálása és újrahasználata
  • Együttműködés a csapat többi tagjával a Stratio-ban
  • Kimenet vizsgálata és integrálása a lefolyó eszközökkel

Összefoglalás és Következő lépések

Követelmények

Audience* A Stratio-alapú platformokon dolgozó adatmérnökök* Analitikusok vagy fejlesztők, akik a Rocket és Intelligence modulokat használják* Technikai csapatok, amelyek átállnak a Stratio-ban lévő PySpark folyamatokra
 14 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák