Kurzusleírás

Bevezetés

  • A Databricks és az Apache Spark áttekintése
  • A Databricks architektúrájának megértése

Bevezetés

  • A környezet beállítása
  • Databricks beállítása és konfigurálása
  • A Databricks felhasználói felületének navigálása
  • Databricks munkaterület létrehozása

Adatok kezelése a Databricksben

  • Csatlakozás egy Apache Spark adatforráshoz
  • Az alapvető oszlopok és adattípusok megértése
  • Fájlrendszer kezelése a Notebookokban

Feladatok és klaszterek kezelése

  • Klaszterek létrehozása és konfigurálása
  • Feladatok létrehozása Notebook segítségével
  • Feladatok futtatása
  • Feladatok és feladatok részleteinek megtekintése

Delta Lake használata a Databricksben

  • Adatok betöltése a Delta Lake-be
  • Adatok kezelése a Delta Lake-ben

Databricks biztonságának kezelése

  • Databricks biztonság kezelése
  • Biztonsági mentés és helyreállítás kezelése

Hibaelhárítás

Összefoglalás és következő lépések

Követelmények

  • Alapvető ismeretek az adatelemzésről
  • Ismeretek az Apache Spark-ról

Célközönség

  • Adatmérnökök
  • Adatszakértők
  • Fejlesztők
 14 Órák

Résztvevők száma


Ár per résztvevő

Közelgő kurzusok

Rokon kategóriák