Kurzusleírás

Bevezetés

A nagy adatok megértése

A Spark áttekintése

A Python áttekintése

A PySpark áttekintése

  • Adatok terjesztése a Resilient Distributed Datasets keretrendszerrel
  • Számítások terjesztése a Spark API operátorokkal

A Python beállítása Sparkkal

A PySpark beállítása

Amazon Web Services (AWS) EC2 példányok használata Sparkhoz

A Databricks beállítása

Az AWS EMR klaszter beállítása

A Python programozás alapjainak megtanulása

  • Bevezetés a Pythonba
  • A Jupyter Notebook használata
  • Változók és egyszerű adattípusok használata
  • Listák használata
  • if állítások használata
  • Felhasználói bemenetek használata
  • while ciklusok használata
  • Függvények implementálása
  • Osztályok használata
  • Fájlok és kivételek használata
  • Projektek, adatok és API-k használata

A Spark DataFrame alapjainak megtanulása

  • Bevezetés a Spark DataFrames-be
  • Alapműveletek implementálása Sparkkal
  • Groupby és aggregációs műveletek használata
  • Időbélyegek és dátumok használata

Spark DataFrame projektgyakorlat

Gépi tanulás megértése MLlib segítségével

MLlib, Spark és Python használata gépi tanuláshoz

Regressziók megértése

  • Lineáris regresszió elméletének megtanulása
  • Regresszió kiértékelő kód implementálása
  • Mintalineáris regressziós gyakorlat
  • Logisztikus regresszió elméletének megtanulása
  • Logisztikus regressziós kód implementálása
  • Mintalogisztikus regressziós gyakorlat

Véletlen erdők és döntési fák megértése

  • Fa módszerek elméletének megtanulása
  • Döntési fák és véletlen erdők kódjainak implementálása
  • Mintavéletlen erdő osztályozási gyakorlat

K-means klaszterezés használata

  • K-means klaszterezés elméletének megértése
  • K-means klaszterező kód implementálása
  • Mintaklaszterezési gyakorlat

Ajánlórendszerek használata

Természetes nyelv feldolgozás implementálása

  • Természetes nyelv feldolgozás (NLP) megértése
  • NLP eszközök áttekintése
  • Minta NLP gyakorlat

Streaming használata Sparkkal Pythonban

  • Streaming áttekintése Sparkkal
  • Minta Spark streaming gyakorlat

Záró megjegyzések

Követelmények

  • Általános programozási ismeretek

Célközönség

  • Fejlesztők
  • IT szakemberek
  • Adattudósok
 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (6)

Közelgő kurzusok

Rokon kategóriák