Kurzusleírás

Machine Learning Bevezetés

  • Gépes tanulás típusai – felügyelt vs. fel nem ügyelt
  • A statisztikai tanulás gépi tanulássá alakulása
  • A data mining munkafolyamat: üzleti megértés, adatok előkészítése, modellalkotás, telepítés
  • A feladathoz megfelelő algoritmus kiválasztása
  • Overfitting és a bias-variance kompromisszum

Python és ML Könyvtárak Áttekintése

  • Miért használjuk a programozási nyelveket ML-hez
  • A választás R és Python között
  • Python gyors bevezetés és Jupyter Notebooks
  • Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn

ML Algoritmusok Tesztelése és Értékelése

  • Generalizáció, overfitting és modellvalidálás
  • Értékelési stratégiák: holdout, keresztvalidálás, bootstrapping
  • Regressziós metrikák: ME, MSE, RMSE, MAPE
  • Osztályozási metrikák: pontosság, összetévesztési mátrix, egyenlőtlen osztályok
  • Modellteljesítmény vizualizálása: profit görbe, ROC görbe, lift görbe
  • Modellkiválasztás és grid search finomítással

Adatok Előkészítése

  • Adatok importálása és tárolása Python-ben
  • Kutatási elemzés és összefoglaló statisztikák
  • Hiányzó értékek és kimagasló értékek kezelése
  • Standardizálás, normalizálás és átalakítás
  • Minőségi adatok újra kodolása és adatok kezelése pandas segítségével

Osztályozási Algoritmusok

  • Kétosztályú vs. többosztályú osztályozás
  • Logisztikus regresszió és diszkriminációs funkciók
  • Naïve Bayes, k-legközelebbi szomszédok
  • Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines és kernelek
  • Ensemble tanulási technikák

Regresszió és Számosítási Előrejelzés

  • Legkisebb négyzetek és változók kiválasztása
  • Regularizációs módszerek: L1, L2
  • Polinomregresszió és nemlineáris modell
  • Regressziós fák és splines

Unsupervised Learning

  • Clusterelési technikák: k-means, k-medoids, hierarchikus clusterelés, SOMs
  • Dimenziócsökkenés: PCA, tényezőelemzés, SVD
  • Sokdimenziós skálázás

Szövegbányászat

  • Szövegek előfeldolgozása és tokenezés
  • Bag-of-words, tőszó, és lemmatizálás
  • Érzéselemzés és szójelforgalom
  • Szövegadatok vizualizálása szójelmélet-ködyökkel

Javaslatszisztémák

  • Felhasználói és tárgyi alapú együttműködő szűrő
  • Javaslatmotorok tervezése és értékelése

Associációs Mintázatbányászat

  • Gyakori elemek halmazai és Apriori algoritmus
  • Vásárlókosár elemzés és lift arány

Kilógó Értékek Felismerése

  • Extremérték elemzés
  • Távolság alapú és sűrűség alapú módszerek
  • Kilógó értékek felismerése magasdimenziós adatokban

Machine Learning Esettanulmány

  • Az üzleti probléma megértése
  • Adatok előfeldolgozása és jellemzők kialakítása
  • Modellkiválasztás és paraméterfinomítás
  • Értékelés és eredmények bemutatása
  • Telepítés

Összefoglalás és Következő Lépések

Követelmények

  • Az estadisztika és a lineáris algebra alapismeretei
  • Ismeret az adatanalitika vagy a business intelligence koncepciókban
  • Valamely programozási nyelvek (legjobb, ha Python vagy R) ismerete ajánlott
  • Érdeklődés az alkalmazott gépi tanulás megismerése iránt adatokból vezérelt projektekhez

Célközönség

  • Adat-analitikák és tudósok
  • Statisztikusok és kutatók
  • Fejlesztők és IT szakemberek, akik a gépi tanulás eszközeit vizsgálják
  • Bárki, aki az adattudomány vagy a prediktív analitika projektekben van
 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (3)

Közelgő kurzusok

Rokon kategóriák