Kurzusleírás

Bevezetés a gépi tanulásba

  • A gépi tanulás típusai – felügyelt és felügyelet nélküli
  • A statisztikai tanulástól a gépi tanulásig
  • Az adatbányászat munkafolyamata: üzleti megértés, adatelőkészítés, modellezés, üzembe helyezés
  • A megfelelő algoritmus kiválasztása a feladathoz
  • Túlillesztés és a bias-variancia kompromisszum

Python és ML könyvtárak áttekintése

  • Miért használjunk programozási nyelveket a gépi tanuláshoz
  • Választás R és Python között
  • Python gyorstalpaló és Jupyter Notebookok
  • Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn

ML algoritmusok tesztelése és értékelése

  • Általánosítás, túlillesztés és modellvalidáció
  • Értékelési stratégiák: holdout, keresztvalidáció, bootstrapping
  • Metrikák regresszióhoz: ME, MSE, RMSE, MAPE
  • Metrikák osztályozáshoz: pontosság, keveredési mátrix, kiegyensúlyozatlan osztályok
  • Modellteljesítmény vizualizációja: nyereség görbe, ROC görbe, lift görbe
  • Modellválasztás és rácsos keresés finomhangoláshoz

Adatelőkészítés

  • Adatok importálása és tárolása Pythonban
  • Felfedező elemzés és összefoglaló statisztikák
  • Hiányzó értékek és kiugró értékek kezelése
  • Standardizálás, normalizálás és transzformáció
  • Minőségi adatok átkódolása és adatátalakítás pandas segítségével

Osztályozási algoritmusok

  • Bináris vs többosztályos osztályozás
  • Logisztikus regresszió és diszkrimináns függvények
  • Naiv Bayes, k-legközelebbi szomszédok
  • Döntési fák: CART, Véletlen Erdők, Bagging, Boosting, XGBoost
  • Támogató vektor gépek és magfüggvények
  • Ensemble tanulási technikák

Regresszió és numerikus előrejelzés

  • Legkisebb négyzetek és változókiválasztás
  • Regularizációs módszerek: L1, L2
  • Polinomiális regresszió és nemlineáris modellek
  • Regressziós fák és spline-ok

Felügyelet nélküli tanulás

  • Klaszterezési technikák: k-átlag, k-medoids, hierarchikus klaszterezés, SOM-ok
  • Dimenziócsökkentés: PCA, faktoranalízis, SVD
  • Többdimenziós skálázás

Szövegbányászat

  • Szöveg előfeldolgozás és tokenizálás
  • Szószámlálás, szótövezés és lemmatizálás
  • Hangulatelemzés és szógyakoriság
  • Szöveges adatok vizualizációja szófelhőkkel

Ajánlórendszerek

  • Felhasználó-alapú és elem-alapú együttműködő szűrés
  • Ajánló motorok tervezése és értékelése

Asszociációs mintázatbányászat

  • Gyakori elemkészletek és Apriori algoritmus
  • Piaci kosár elemzés és lift arány

Kiugró értékek észlelése

  • Extrém értékek elemzése
  • Távolság-alapú és sűrűség-alapú módszerek
  • Kiugró értékek észlelése nagy dimenziójú adatokban

Gépi tanulási esettanulmány

  • Az üzleti probléma megértése
  • Adatelőkészítés és jellemzők tervezése
  • Modellválasztás és paraméterek finomhangolása
  • Értékelés és eredmények bemutatása
  • Üzembe helyezés

Összefoglalás és következő lépések

Követelmények

  • Alapvető ismeretek a statisztikában és a lineáris algebrában
  • Ismeretek az adatelemzés vagy üzleti intelligencia fogalmaiban
  • Ajánlott némi programozási tapasztalat (előnyösen Python vagy R)
  • Érdeklődés a gépi tanulás alkalmazása iránt adatvezérelt projektekben

Célközönség

  • Adatelemzők és adattudósok
  • Statisztikusok és kutatószakemberek
  • Fejlesztők és informatikai szakemberek, akik gépi tanulási eszközöket szeretnének felfedezni
  • Mindenki, aki adattudományi vagy prediktív elemzési projektekben vesz részt
 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (3)

Közelgő kurzusok

Rokon kategóriák