Kurzusleírás

    Bevezetés a gépi tanulásba A gépi tanulás típusai – felügyelt vagy nem felügyelt tanulás A statisztikai tanulástól a gépi tanulásig Az adatbányászati munkafolyamat: az üzleti élet megértése az adatok megértése az adatok előkészítése Modellezés Értékelés Telepítés Gépi tanulási algoritmusok A megfelelő algoritmus kiválasztása a problémához Túlillesztés és torzítás-variancia kompromisszum az ML ML-ben könyvtárak és programozási nyelvek Miért érdemes programozási nyelvet használni? Választás az R és a Python Python gyorstanfolyam között Python-források Python-könyvtárak gépi tanuláshoz Jupyter notebookok és interaktív kódolás ML algoritmusok tesztelése Általánosítás és túlillesztés A túlillesztés elkerülése Holdout módszer Keresztellenőrzés Bootstrapping Numerikus előrejelzések kiértékelése Meccascyures ME, MSE, RMSE, MAPE Paraméterek és előrejelzési stabilitás Osztályozási algoritmusok kiértékelése Pontosság és problémái A zavaros mátrix Kiegyensúlyozatlan osztályok probléma Modell teljesítményének megjelenítése Profit görbe ROC görbe Emelési görbe Modellválasztás Modellhangolás – rácskeresési stratégiák Példák Pythonban Adat-előkészítés Adatimport és -tárolás Az adatok értelmezése – alapvető feltárások Adatmanipulációk panda könyvtárral Adatátalakítások – Adatviszály Feltáró elemzés Hiányzó megfigyelések – észlelés és megoldások Kiugró értékek – észlelés és stratégiák Szabványosítás, normalizálás, binarizálás Kvalitatív adatok újrakódolása Példák a Python osztályozásban Bináris vs többosztályos osztályozás Osztályozás matematikai függvényekkel Line diszkriminancia függvények Másodfokú diszkriminancia függvények Logisztikus regresszió és valószínűségi megközelítés k-legközelebbi szomszédok Naív Bayes Döntési fák CART Bagging Random Forests Boost Xgboost Support Vector Gépek és kernelek Maximális árrés osztályozó támogatása Vector Machine Ensemble tanulás Példák Pythonban Regresszió és numerikus előrejelzés Leastti squares szelekciós technikák Regularizálás és stabilitás- L1, L2 Nemlinearitások és általánosított legkisebb négyzetek Polinom regresszió Regressziós spline-ok Regressziós fák Példák Pythonban Felügyelet nélküli tanulás Klaszterezés Centroid alapú klaszterezés – k-means, k-medoids, PAM, CLARA Hierarchikus klaszterezés – Diana-, Agnes Modell alapú klaszterezés - EM Önszervező térképek Klaszterek kiértékelése és értékelése Dimenziócsökkentés Főkomponens-elemzés és faktoranalízis Szinguláris értékbontás Többdimenziós skálázási példák Pythonban Szövegbányászat Adatok előfeldolgozása A zsákos szómodell Szógyakoriságok elemzése Érzelmi elemzés Szófelhők létrehozása Példák Pythonban Recommendations motorok és kollaboratív szűrés Javasolt adatok Felhasználó alapú együttműködési szűrés Tétel alapú együttműködési szűrés Példák Pythonban Asszociációs mintabányászat Gyakori elemkészletek algoritmusa Piackosár elemzés Példák a Python Outlier Analysis programban Extrém érték elemzés Távolság alapú kiugró értékek észlelése Sűrűség alapú módszerek High- dimenziós kiugró értékek észlelése Példák a Python Machine Learning esettanulmányban Üzleti problémamegértés Adatok előfeldolgozása Algoritmus kiválasztása és hangolás Az eredmények értékelése Telepítés

 

 

Követelmények

A Machine Learning alapelemek ismerete és tudatossága

 21 Hours

Résztvevők száma



Ár per résztvevő

Vélemények (3)

Rokon tanfolyam

Rokon kategóriák