Kurzusleírás

Bevezetés a Stratio platformba

  • A Stratio architektúrájának és alapmoduljainak áttekintése
  • A Rocket és Intelligence szerepe az adatéletciklusban
  • Bejelentkezés és navigálás a Stratio felületen

A Rocket modullal való munka

  • Adatbetöltés és folyamatok létrehozása
  • Adatforrások csatlakoztatása és átalakítások konfigurálása
  • PySpark használata előfeldolgozási feladatokhoz a Rocketban

PySpark alapok Stratio felhasználók számára

  • PySpark adatszerkezetek és műveletek
  • Ciklusstruktúrák: for, while, if/else használata
  • Egyéni függvények írása def-fel és alkalmazásuk

Rocket haladó használata PySparkkal

  • Streames adatbetöltés és átalakítások
  • Ciklusok és függvények használata kötegelt és valós idejű forgatókönyvekben
  • Ajánlott eljárások a PySpark folyamatok teljesítményéhez

Az Intelligence modul felfedezése

  • Adatmodellezés és elemzési funkciók áttekintése
  • Jellemzőkiválasztás, átalakítás és feltárás
  • A PySpark szerepe egyéni elemzésekben és betekintésekben

Haladó elemzési munkafolyamatok készítése

  • Felhasználó által definiált függvények (UDF) létrehozása az Intelligence modulban
  • Feltételek és ciklusok alkalmazása adatlogikához
  • Használati esetek: szegmentálás, aggregáció és előrejelzés

Üzembe helyezés és együttműködés

  • Munkafolyamatok mentése, exportálása és újrafelhasználása
  • Együttműködés más csapattagokkal a Stratio-n
  • Kimenet áttekintése és integráció lefelé tartó eszközökkel

Összefoglalás és következő lépések

Követelmények

  • Tapasztalat Python programozásban
  • Ismeret az adatelemzés vagy big data feldolgozás alapjairól
  • Alapvető ismeretek az Apache Spark és a disztribuált számítások területén

Közönség

  • Stratio alapú platformokon dolgozó adatmérnökök
  • A Rocket és Intelligence modulokat használó elemzők vagy fejlesztők
  • PySpark munkafolyamatokra váltó technikai csapatok a Stratio-n belül
 14 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (4)

Közelgő kurzusok

Rokon kategóriák