Kurzusleírás
- Bevezetés a gépi tanulásba A gépi tanulás típusai – felügyelt vagy nem felügyelt tanulás A statisztikai tanulástól a gépi tanulásig Az adatbányászati munkafolyamat: az üzleti élet megértése az adatok megértése az adatok előkészítése Modellezés Értékelés Telepítés Gépi tanulási algoritmusok A megfelelő algoritmus kiválasztása a problémához Túlillesztés és torzítás-variancia kompromisszum az ML ML-ben könyvtárak és programozási nyelvek Miért érdemes programozási nyelvet használni? Választás az R és a Python Python gyorstanfolyam között Python-források Python-könyvtárak gépi tanuláshoz Jupyter notebookok és interaktív kódolás ML algoritmusok tesztelése Általánosítás és túlillesztés A túlillesztés elkerülése Holdout módszer Keresztellenőrzés Bootstrapping Numerikus előrejelzések kiértékelése Meccascyures ME, MSE, RMSE, MAPE Paraméterek és előrejelzési stabilitás Osztályozási algoritmusok kiértékelése Pontosság és problémái A zavaros mátrix Kiegyensúlyozatlan osztályok probléma Modell teljesítményének megjelenítése Profit görbe ROC görbe Emelési görbe Modellválasztás Modellhangolás – rácskeresési stratégiák Példák Pythonban Adat-előkészítés Adatimport és -tárolás Az adatok értelmezése – alapvető feltárások Adatmanipulációk panda könyvtárral Adatátalakítások – Adatviszály Feltáró elemzés Hiányzó megfigyelések – észlelés és megoldások Kiugró értékek – észlelés és stratégiák Szabványosítás, normalizálás, binarizálás Kvalitatív adatok újrakódolása Példák a Python osztályozásban Bináris vs többosztályos osztályozás Osztályozás matematikai függvényekkel Line diszkriminancia függvények Másodfokú diszkriminancia függvények Logisztikus regresszió és valószínűségi megközelítés k-legközelebbi szomszédok Naív Bayes Döntési fák CART Bagging Random Forests Boost Xgboost Support Vector Gépek és kernelek Maximális árrés osztályozó támogatása Vector Machine Ensemble tanulás Példák Pythonban Regresszió és numerikus előrejelzés Leastti squares szelekciós technikák Regularizálás és stabilitás- L1, L2 Nemlinearitások és általánosított legkisebb négyzetek Polinom regresszió Regressziós spline-ok Regressziós fák Példák Pythonban Felügyelet nélküli tanulás Klaszterezés Centroid alapú klaszterezés – k-means, k-medoids, PAM, CLARA Hierarchikus klaszterezés – Diana-, Agnes Modell alapú klaszterezés - EM Önszervező térképek Klaszterek kiértékelése és értékelése Dimenziócsökkentés Főkomponens-elemzés és faktoranalízis Szinguláris értékbontás Többdimenziós skálázási példák Pythonban Szövegbányászat Adatok előfeldolgozása A zsákos szómodell Szógyakoriságok elemzése Érzelmi elemzés Szófelhők létrehozása Példák Pythonban Recommendations motorok és kollaboratív szűrés Javasolt adatok Felhasználó alapú együttműködési szűrés Tétel alapú együttműködési szűrés Példák Pythonban Asszociációs mintabányászat Gyakori elemkészletek algoritmusa Piackosár elemzés Példák a Python Outlier Analysis programban Extrém érték elemzés Távolság alapú kiugró értékek észlelése Sűrűség alapú módszerek High- dimenziós kiugró értékek észlelése Példák a Python Machine Learning esettanulmányban Üzleti problémamegértés Adatok előfeldolgozása Algoritmus kiválasztása és hangolás Az eredmények értékelése Telepítés
Követelmények
A Machine Learning alapelemek ismerete és tudatossága
Vélemények (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Kurzus - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback