Kurzusleírás

Bevezetés a Google Colab és Apache Spark használatába

  • A Google Colab áttekintése
  • Bevezetés az Apache Spark használatába
  • Spark beállítása a Google Colab-ban

Adatfeldolgozás Apache Spark segítségével

  • Munka RDD-kkel és DataFrame-ekkel
  • Nagy adathalmazok betöltése és feldolgozása
  • Strukturált adatok lekérdezése Spark SQL segítségével

Speciális elemzések Spark segítségével

  • Gépi tanulás a Spark MLlib segítségével
  • Valós idejű adatelemzés végrehajtása
  • Elosztott számítások Spark segítségével

Vizualizáció és együttműködés a Google Colab-ban

  • Colab integrálása népszerű vizualizációs könyvtárakkal
  • Együttműködő munkafolyamatok Colab notebookokkal
  • Eredmények megosztása és exportálása

Big Data munkafolyamatok optimalizálása

  • Spark finomhangolása a teljesítmény érdekében
  • Memória- és tárolóhasználat optimalizálása
  • Munkafolyamatok skálázása nagy adathalmazokhoz

Big Data a felhőben

  • Google Colab integrálása felhőalapú eszközökkel
  • Felhőalapú tároló használata nagy adatokhoz
  • Spark használata elosztott felhőkörnyezetekben

Esettanulmányok és ajánlott eljárások

  • Valós világi Big Data alkalmazások áttekintése
  • Esettanulmányok Apache Spark és Colab használatával
  • Ajánlott eljárások a Big Data elemzéshez

Összefoglalás és következő lépések

Követelmények

  • Alapvető ismeretek az adattudomány alapjairól
  • Ismeretek az Apache Spark használatáról
  • Python programozási ismeretek

Célközönség

  • Adattudósok
  • Adatmérnökök
  • Nagy adatokkal dolgozó kutatók
 14 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (4)

Közelgő kurzusok

Rokon kategóriák