Kurzusleírás

Machine Learning Bevezetés

  • Gépies tanulás típusai – felügyelt vs. nem felügyelt
  • A statisztikai tanulástól a gépi tanulásig
  • A bányászati munkafolyamat: üzleti megértés, adatfeldolgozás, modellkészítés, telepítés
  • A megfelelő algoritmus kiválasztása a feladathoz
  • Túlillesztés és a bias-variance kompromisszum

Python és ML Könyvtárak Áttekintése

  • Miért használjuk a programozási nyelveket ML-hez
  • A választás R és Python között
  • Python rövid áttekintés és Jupyter Notebooks
  • Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn

ML Algoritmusok Tesztelése és Értékelése

  • Általánosítás, túlillesztés és modellvalidáció
  • Értékelési stratégiák: holdout, keresztezett validáció, bootstrapping
  • Regressziós mérték: ME, MSE, RMSE, MAPE
  • Osztályozás mértéke: pontosság, összekeverés mátrix, egyensúlytalan osztályok
  • Modell teljesítmény vizualizációja: profit görbe, ROC görbe, lift görbe
  • Modell kiválasztás és grid search beállítása

Adatfeldolgozás

  • Adatimport és tárolás Python-ban
  • Feltáró elemzés és összegező statisztika
  • Hiányzó értékek és kivételes értékek kezelése
  • Standardizálás, normalizálás és transzformáció
  • Kvalitatív adat átalakítás és adatok manipulálása pandas-szal

Osztályozási Algoritmusok

  • Bináris vs. többosztályú osztályozás
  • Logisztikus regresszió és differenciálfüggvények
  • Naïve Bayes, k legközelebbi szomszédok
  • Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines és kernelek
  • Együttműködési tanulási technikák

Regresszió és Számos Vorhálózás

  • Legkisebb négyzetek és változó kiválasztás
  • Regularizálási módszerek: L1, L2
  • Polynomial regresszió és nemlineáris modellek
  • Regressziós fák és spline-k

Neural Networks

  • A neurális hálózatok és mély tanulás bevezetése
  • Aktiválási függvények, rétegek és visszaterjesztés
  • Multilayer perceptrons (MLP)
  • TensorFlow vagy PyTorch használata alapszintű neurális hálózat modellkészítéshez
  • Neurális hálózatok osztályozáshoz és regresszióhoz

Eladás Forecasting és Predictive Analytics

  • Idősor vs. regresszió alapú előrejelzés
  • Szezonális és trend alapú adat kezelése
  • Eladási előrejelzési modell készítése ML technikák használatával
  • Előrejelzési pontosság és bizonytalanság értékelése
  • Business értelmezése és eredményeinek kommunikálása

Unsupervised Learning

  • Cluster technikák: k-means, k-medoids, hierarchikus cluster, SOMs
  • Dimenziális redukció: PCA, faktoranalízis, SVD
  • Multidimenziós skalázás

Szövegbányászat

  • Szövegfeldolgozás és tokenizáció
  • Bag-of-words, szótők és lemmatizáció
  • Érzékelésanalízis és szógyakoriság
  • Szöveges adat vizualizálása szófelhők segítségével

Javasolási Rendszerek

  • Felhasználói és tárgy alapú együttműködő szűrés
  • Javasolási motorok tervezése és értékelése

Associációs Minta Bányászat

  • Gyakori elemek és Apriori algoritmus
  • Piackosár elemzés és lift arány

Kivételes Értékek Értékelése

  • Extreme érték elemzés
  • Távolság és sűrűség alapú módszerek
  • Kivételes érték detektálása magas dimenziós adatokban

Machine Learning Eseményjegyzék

  • Az üzleti probléma megértése
  • Adatfeldolgozás és jellemzők tervezése
  • Modell kiválasztás és paraméterbeállítás
  • Értékelés és találatok bemutatása
  • Telepítés

Összegzés és Következő lépések

Követelmények

  • Alapvető ismeretek a gépi tanulás fogalmai, például felügyelt és felügyelt nélküli tanulás
  • Python programozás ismerete (változók, ciklusok, függvények)
  • A pandas vagy NumPy könyvtárak használatával történő adatok kezelésének valamilyen tapasztalata hasznos, de nem kötelező
  • Nincs szükség előzetes tapasztalatra előrehaladott modellalkodással vagy neuronhálókkal

Célközönség

  • Adat tudósok
  • Business analitikák
  • Adatokat kezelő szoftvermérnökök és technikai szakemberek
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (2)

Közelgő kurzusok

Rokon kategóriák