Kurzusleírás
Bevezetés a gépi tanulásba
- A gépi tanulás típusai – felügyelt és felügyelet nélküli
- A statisztikai tanulástól a gépi tanulásig
- Az adatbányászat munkafolyamata: üzleti megértés, adatelőkészítés, modellezés, üzembe helyezés
- A megfelelő algoritmus kiválasztása a feladathoz
- Túlillesztés és a bias-variancia kompromisszum
Python és ML könyvtárak áttekintése
- Miért használjunk programozási nyelveket a gépi tanuláshoz
- Választás R és Python között
- Python gyorstalpaló és Jupyter Notebookok
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML algoritmusok tesztelése és értékelése
- Általánosítás, túlillesztés és modellvalidáció
- Értékelési stratégiák: holdout, keresztvalidáció, bootstrapping
- Metrikák regresszióhoz: ME, MSE, RMSE, MAPE
- Metrikák osztályozáshoz: pontosság, keveredési mátrix, kiegyensúlyozatlan osztályok
- Modellteljesítmény vizualizációja: nyereség görbe, ROC görbe, lift görbe
- Modellválasztás és rácsos keresés finomhangoláshoz
Adatelőkészítés
- Adatok importálása és tárolása Pythonban
- Felfedező elemzés és összefoglaló statisztikák
- Hiányzó értékek és kiugró értékek kezelése
- Standardizálás, normalizálás és transzformáció
- Minőségi adatok átkódolása és adatátalakítás pandas segítségével
Osztályozási algoritmusok
- Bináris vs többosztályos osztályozás
- Logisztikus regresszió és diszkrimináns függvények
- Naiv Bayes, k-legközelebbi szomszédok
- Döntési fák: CART, Véletlen Erdők, Bagging, Boosting, XGBoost
- Támogató vektor gépek és magfüggvények
- Ensemble tanulási technikák
Regresszió és numerikus előrejelzés
- Legkisebb négyzetek és változókiválasztás
- Regularizációs módszerek: L1, L2
- Polinomiális regresszió és nemlineáris modellek
- Regressziós fák és spline-ok
Felügyelet nélküli tanulás
- Klaszterezési technikák: k-átlag, k-medoids, hierarchikus klaszterezés, SOM-ok
- Dimenziócsökkentés: PCA, faktoranalízis, SVD
- Többdimenziós skálázás
Szövegbányászat
- Szöveg előfeldolgozás és tokenizálás
- Szószámlálás, szótövezés és lemmatizálás
- Hangulatelemzés és szógyakoriság
- Szöveges adatok vizualizációja szófelhőkkel
Ajánlórendszerek
- Felhasználó-alapú és elem-alapú együttműködő szűrés
- Ajánló motorok tervezése és értékelése
Asszociációs mintázatbányászat
- Gyakori elemkészletek és Apriori algoritmus
- Piaci kosár elemzés és lift arány
Kiugró értékek észlelése
- Extrém értékek elemzése
- Távolság-alapú és sűrűség-alapú módszerek
- Kiugró értékek észlelése nagy dimenziójú adatokban
Gépi tanulási esettanulmány
- Az üzleti probléma megértése
- Adatelőkészítés és jellemzők tervezése
- Modellválasztás és paraméterek finomhangolása
- Értékelés és eredmények bemutatása
- Üzembe helyezés
Összefoglalás és következő lépések
Követelmények
- Alapvető ismeretek a statisztikában és a lineáris algebrában
- Ismeretek az adatelemzés vagy üzleti intelligencia fogalmaiban
- Ajánlott némi programozási tapasztalat (előnyösen Python vagy R)
- Érdeklődés a gépi tanulás alkalmazása iránt adatvezérelt projektekben
Célközönség
- Adatelemzők és adattudósok
- Statisztikusok és kutatószakemberek
- Fejlesztők és informatikai szakemberek, akik gépi tanulási eszközöket szeretnének felfedezni
- Mindenki, aki adattudományi vagy prediktív elemzési projektekben vesz részt
Vélemények (3)
Még akkor is, hogy egy napot a ügyfél-találkozók miatt kellett elhanyagolnom, úgy érzem, sokkal pontosabban értem a gépi tanulásban használt folyamatokat és technikákat, valamint mikor melyik módszerévet kell alkalmazni. Most a kihívásunk, hogy gyakoroljuk meg amit megtanultunk, és kezdjük el alkalmazni azt a problématerületünkre.
Richard Blewett - Rock Solid Knowledge Ltd
Kurzus - Machine Learning – Data science
Gépi fordítás
Szerettem, hogy a képzés példákra és programozásra koncentrálta magát. Úgy gondoltam, nem lehet annyi anyagot három nap alatt belefésülni egy képzésbe, de tévedtem. A képzés számos témakört fedett le, és minden nagyon részletesen volt készítve (különösen a modell paramétereinek finomhangolása - nem vártam, hogy erre lesz idő, és nagyon megleptem magam).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
Gépi fordítás
Számos módszert mutat be előkészített szkriptekkel - nagyon jól felkészült anyagokkal és könnyen nyomonkövethetően.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
Gépi fordítás