Kurzusleírás

Gépezeti Tanulás Bevezetés

  • Gépezeti tanulás típusai – felügyelt vs. fel nem ügyelt
  • A statisztikai tanulástól a gépezeti tanulásig
  • Az adattárolás munkafolyamata: üzleti megértés, adatok előkészítése, modellkészítés, bevezetés
  • A megfelelő algoritmus választása a feladathoz
  • Tulajdonoskodás és a bias-variance kompromisszum

Python és ML Könyvtárak Áttekintése

  • Miért használjuk a programozási nyelveket ML-hez
  • Választás R és Python között
  • Python gyorskurszus és Jupyter Notebookok
  • Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn

Gépezeti Tanulási Algoritmusok Tesztelése és Értékelése

  • Generalizálás, túltanulás és modell validálása
  • Értékelő stratégiák: holdout, keresztvalidálás, bootstrapping
  • Metrikák regresszióhoz: ME, MSE, RMSE, MAPE
  • Metrikák osztályozáshoz: pontosság, összekeverési mátrix, nem egyensúlyos osztályok
  • Modell teljesítmény vizualizálása: profit görbe, ROC görbe, lift görbe
  • Modell kiválasztás és grid search finomításhoz

Adatok Előkészítése

  • Adatok importálása és tárolása Pythonban
  • Kutatási elemzés és összegező statisztikák
  • Hiányzó értékek és kivételes értékek kezelése
  • Szabványosítás, normalizálás és átalakítás
  • Kvalitatív adatok átkódolása és adatok kezelése pandas-al

Osztályozási Algoritmusok

  • Bináris vs. többosztályos osztályozás
  • Logisztikai regresszió és diszkrimináns függvények
  • Naïve Bayes, k-legközelebbi szomszéd
  • Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
  • Támogató vektor gépek és kernel-ek
  • Együttes tanulási technikák

Regresszió és Számtani Előrejelzés

  • Legkisebb négyzetek és változó választás
  • Regularizációs módszerek: L1, L2
  • Polinom regresszió és nemlineáris modell
  • Regressziós fák és splines

Neuronhálózatok

  • Bevezetés a neuronhálózatokba és mélységi tanulásba
  • Aktíválási függvények, rétegek és visszafelé terjedő propagáció
  • Többrétegű perceptronok (MLP)
  • TensorFlow vagy PyTorch használata alapos neuronhálózat modellkészítéshez
  • Neuronhálózatok osztályozáshoz és regresszióhoz

Eladó Előrejelzés és Előrejelző Analitika

  • Idősorozatos vs. regresszió alapú előrejelzés
  • Szezonális és trend alapú adatok kezelése
  • Eladó előrejelző modell készítése ML technikákkal
  • Előrejelzés pontoságának és bizonytalanságának értékelése
  • Üzleti értelmezés és eredmények kommunikálása

Fel nem Ügyelt Tanulás

  • Csoportosítási technikák: k-means, k-medoid, hierarchikus csoportosítás, SOM-ok
  • Dimenziócsökkentés: PCA, faktoranalízis, SVD
  • Többdimenziós skálázás

Szövegek Bányászata

  • Szövegek előkészítése és tokenizálása
  • Szócsomag, származékok és alaktani alakok
  • Érzésteljes elemzés és szógyakoriság
  • Szöveges adatok vizualizálása szófelhőkkel

Ajánló Rendszerek

  • Felhasználó alapú és tárgy alapú együttműködő szűrők
  • Ajánló motorok tervezése és értékelése

Asszociációs Mintázat Bányászata

  • Gyakori elemek halmazai és Apriori algoritmus
  • Piaci kosár elemzés és lift arány

Kivétel Érzékelés

  • Extremumérték elemzés
  • Táv és sűrűség alapú módszerek
  • Kivétel érzékelés magas dimenziós adatokban

Gépezeti Tanulás Esettanulmány

  • Üzleti problémák megértése
  • Adatok előkészítése és jellemzőmérés
  • Modell kiválasztás és paraméter finomítása
  • Eredmények értékelése és bemutatása
  • Bevezetés

Összegzés és Következő Lépések

Követelmények

  • Gépesített tanulás alapelveinek ismerete, például felügyelt és fel nem ügyelt tanulás
  • Ismeret a Python programozással (változók, ciklusok, függvények)
  • Segít, de nem kötelező, ha van tapasztalata adatok kezelésével pandas vagy NumPy könyvtárak használatával
  • Nem várunk előzetes tapasztalatot előrehaladott modellelés vagy neurális hálózatok használatával

Célközönség

  • Adattudósok
  • Üzleti elemzők
  • Szoftvermérnökök és technikai szakemberek, akik adatokkal dolgoznak
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (2)

Közelgő kurzusok

Rokon kategóriák