Kurzusleírás
Machine Learning Bevezetés
- Gépes tanulás típusai – felügyelt vs. fel nem ügyelt
- A statisztikai tanulás gépi tanulássá alakulása
- A data mining munkafolyamat: üzleti megértés, adatok előkészítése, modellalkotás, telepítés
- A feladathoz megfelelő algoritmus kiválasztása
- Overfitting és a bias-variance kompromisszum
Python és ML Könyvtárak Áttekintése
- Miért használjuk a programozási nyelveket ML-hez
- A választás R és Python között
- Python gyors bevezetés és Jupyter Notebooks
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML Algoritmusok Tesztelése és Értékelése
- Generalizáció, overfitting és modellvalidálás
- Értékelési stratégiák: holdout, keresztvalidálás, bootstrapping
- Regressziós metrikák: ME, MSE, RMSE, MAPE
- Osztályozási metrikák: pontosság, összetévesztési mátrix, egyenlőtlen osztályok
- Modellteljesítmény vizualizálása: profit görbe, ROC görbe, lift görbe
- Modellkiválasztás és grid search finomítással
Adatok Előkészítése
- Adatok importálása és tárolása Python-ben
- Kutatási elemzés és összefoglaló statisztikák
- Hiányzó értékek és kimagasló értékek kezelése
- Standardizálás, normalizálás és átalakítás
- Minőségi adatok újra kodolása és adatok kezelése pandas segítségével
Osztályozási Algoritmusok
- Kétosztályú vs. többosztályú osztályozás
- Logisztikus regresszió és diszkriminációs funkciók
- Naïve Bayes, k-legközelebbi szomszédok
- Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines és kernelek
- Ensemble tanulási technikák
Regresszió és Számosítási Előrejelzés
- Legkisebb négyzetek és változók kiválasztása
- Regularizációs módszerek: L1, L2
- Polinomregresszió és nemlineáris modell
- Regressziós fák és splines
Unsupervised Learning
- Clusterelési technikák: k-means, k-medoids, hierarchikus clusterelés, SOMs
- Dimenziócsökkenés: PCA, tényezőelemzés, SVD
- Sokdimenziós skálázás
Szövegbányászat
- Szövegek előfeldolgozása és tokenezés
- Bag-of-words, tőszó, és lemmatizálás
- Érzéselemzés és szójelforgalom
- Szövegadatok vizualizálása szójelmélet-ködyökkel
Javaslatszisztémák
- Felhasználói és tárgyi alapú együttműködő szűrő
- Javaslatmotorok tervezése és értékelése
Associációs Mintázatbányászat
- Gyakori elemek halmazai és Apriori algoritmus
- Vásárlókosár elemzés és lift arány
Kilógó Értékek Felismerése
- Extremérték elemzés
- Távolság alapú és sűrűség alapú módszerek
- Kilógó értékek felismerése magasdimenziós adatokban
Machine Learning Esettanulmány
- Az üzleti probléma megértése
- Adatok előfeldolgozása és jellemzők kialakítása
- Modellkiválasztás és paraméterfinomítás
- Értékelés és eredmények bemutatása
- Telepítés
Összefoglalás és Következő Lépések
Követelmények
- Az estadisztika és a lineáris algebra alapismeretei
- Ismeret az adatanalitika vagy a business intelligence koncepciókban
- Valamely programozási nyelvek (legjobb, ha Python vagy R) ismerete ajánlott
- Érdeklődés az alkalmazott gépi tanulás megismerése iránt adatokból vezérelt projektekhez
Célközönség
- Adat-analitikák és tudósok
- Statisztikusok és kutatók
- Fejlesztők és IT szakemberek, akik a gépi tanulás eszközeit vizsgálják
- Bárki, aki az adattudomány vagy a prediktív analitika projektekben van
Vélemények (3)
Még akkor is, hogy egy napot a ügyfél-találkozók miatt kellett elhanyagolnom, úgy érzem, sokkal pontosabban értem a gépi tanulásban használt folyamatokat és technikákat, valamint mikor melyik módszerévet kell alkalmazni. Most a kihívásunk, hogy gyakoroljuk meg amit megtanultunk, és kezdjük el alkalmazni azt a problématerületünkre.
Richard Blewett - Rock Solid Knowledge Ltd
Kurzus - Machine Learning – Data science
Gépi fordítás
Szerettem, hogy a képzés példákra és programozásra koncentrálta magát. Úgy gondoltam, nem lehet annyi anyagot három nap alatt belefésülni egy képzésbe, de tévedtem. A képzés számos témakört fedett le, és minden nagyon részletesen volt készítve (különösen a modell paramétereinek finomhangolása - nem vártam, hogy erre lesz idő, és nagyon megleptem magam).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
Gépi fordítás
Számos módszert mutat be előkészített szkriptekkel - nagyon jól felkészült anyagokkal és könnyen nyomonkövethetően.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
Gépi fordítás