Kurzusleírás

Bevezetés

Megértés Big Data

A Spark áttekintése

A Python áttekintése

A PySpark áttekintése

  • Adatok elosztása rugalmas elosztott adatkészletek keretrendszerrel
  • Számítás elosztása Spark API-operátorok segítségével

Beállítás Python a Spark segítségével

Beállítás PySpark

Amazon Web Services (AWS) EC2 példányok használata a Sparkhoz

Beállítás Databricks

Az AWS EMR-fürt beállítása

A Python Programming alapjainak elsajátítása

  • Kezdő lépések a Python használatával
  • A Jupyter notebook használata
  • Változók és egyszerű adattípusok használata
  • Munka a listákkal
  • Az if-kimutatások használata
  • Felhasználói bemenetek használata
  • A while Loops használata
  • Funkciók megvalósítása
  • Osztályokkal való munka
  • Fájlok és kivételek kezelése
  • Munka projektekkel, adatokkal és API-kkal

A Spark DataFrame alapjainak elsajátítása

  • A Spark DataFrames használatának első lépései
  • Alapvető műveletek végrehajtása a Spark segítségével
  • Groupby és Aggregate Operations használata
  • Időbélyegek és dátumok használata

Spark DataFrame projekt gyakorlaton való munka

A Machine Learning értelmezése az MLlib segítségével

MLlib, Spark és Python használata a Machine Learning-hoz

A regressziók megértése

  • Lineáris regresszióelmélet elsajátítása
  • Regressziós értékelési kód végrehajtása
  • Egy minta lineáris regressziós gyakorlaton való munka
  • Logisztikai regresszióelmélet elsajátítása
  • Logisztikai regressziós kód végrehajtása
  • Minta logisztikai regressziós gyakorlaton dolgozni

A Random Forest-ok megértése és a döntési fák

  • Tanulási fa módszerek elmélete
  • Végrehajtási határozatok fák és Random Forest kódok
  • Munka egy mintán Random Forest Osztályozási gyakorlat

Munka a K-eszközök klaszterezéssel

  • A K-eszközök klaszterezés elméletének megértése
  • K-eszköz klaszterezési kód megvalósítása
  • Mintacsoportosítási gyakorlaton való munka

Recommender Systems használata

A természetes nyelvi feldolgozás megvalósítása

  • Megértés Natural Language Processing (NLP)
  • Az NLP eszközök áttekintése
  • Munka egy minta NLP gyakorlaton

Streamelés a Spark segítségével a Python-en

  • Áttekintés Streamelés a Spark segítségével
  • Minta Spark Streaming Gyakorlat

Zárszó

Követelmények

  • Általános programozási ismeretek

Közönség

  • Fejlesztők
  • IT szakemberek
  • Adattudósok
  21 Hours
 

Résztvevők száma


Tanfolyam kezdete

Tanfolyam vége


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Vélemények (5)

Rokon tanfolyam

Rokon kategóriák