Kurzusleírás

Bevezetés a Google Colab és Apache Spark használatába

  • Áttekintés a Google Colab használatáról
  • Bevezetés a Apache Spark használatába
  • Spark beállítása a Google Colab használatához

Adatfeldolgozás Apache Spark segítségével

  • RDD-k és DataFrames használata
  • Nagy adathalmazok betöltése és feldolgozása
  • Spark SQL használata strukturált adatok lekérdezéséhez

Haladó analitika Sparkkal

  • Gépes tanulás Spark MLlib segítségével
  • Valós idejű adatanalízis
  • Elosztott számítástechnika Sparkkal

Vizualizáció és Collaboration a Google Colab használatában

  • Colab integrálása népszerű vizualizációs könyvtárakkal
  • Együttműködő munkafolyamatok Colab jegyzőkönyvekkel
  • Eredmények megosztása és exportálása

Big Data munkafolyamatok optimalizálása

  • Spark teljesítménybeállítása
  • Memória és tárolásoptimalizálás
  • Munkafolyamatok skálázása nagy adathalmazokra

Big Data a felhőben

  • Google Colab integrálása felhőalapú eszközökkel
  • Felhőtárolás nagy adatokhoz
  • Spark használata elosztott felhői környezetben

Eseményeket és legjobb gyakorlatokat mutatunk be

  • Valós világbeli nagyadatok alkalmazások áttekintése
  • Események Apache Spark és Colab használatával
  • Legjobb gyakorlatok nagyadatok analitikájához

Összefoglalás és következő lépések

Követelmények

  • Adatok tudományának alapvető fogalmainak ismerete
  • Apache Spark-hoz való ismeret
  • Python programozási készségek

A közönség

  • Adattudósok
  • Adatmérnökök
  • Nagyadatokat feldolgozó kutatók
 14 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák