Kurzusleírás
Machine Learning Bevezetés
- Gépes tanulás típusai – felügyelt vs. fel nem ügyelt
- A statisztikai tanulás gépi tanulássá alakulása
- A data mining munkafolyamat: üzleti megértés, adatok előkészítése, modellalkotás, telepítés
- A feladathoz megfelelő algoritmus kiválasztása
- Overfitting és a bias-variance kompromisszum
Python és ML Könyvtárak Áttekintése
- Miért használjuk a programozási nyelveket ML-hez
- A választás R és Python között
- Python gyors bevezetés és Jupyter Notebooks
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML Algoritmusok Tesztelése és Értékelése
- Generalizáció, overfitting és modellvalidálás
- Értékelési stratégiák: holdout, keresztvalidálás, bootstrapping
- Regressziós metrikák: ME, MSE, RMSE, MAPE
- Osztályozási metrikák: pontosság, összetévesztési mátrix, egyenlőtlen osztályok
- Modellteljesítmény vizualizálása: profit görbe, ROC görbe, lift görbe
- Modellkiválasztás és grid search finomítással
Adatok Előkészítése
- Adatok importálása és tárolása Python-ben
- Kutatási elemzés és összefoglaló statisztikák
- Hiányzó értékek és kimagasló értékek kezelése
- Standardizálás, normalizálás és átalakítás
- Minőségi adatok újra kodolása és adatok kezelése pandas segítségével
Osztályozási Algoritmusok
- Kétosztályú vs. többosztályú osztályozás
- Logisztikus regresszió és diszkriminációs funkciók
- Naïve Bayes, k-legközelebbi szomszédok
- Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines és kernelek
- Ensemble tanulási technikák
Regresszió és Számosítási Előrejelzés
- Legkisebb négyzetek és változók kiválasztása
- Regularizációs módszerek: L1, L2
- Polinomregresszió és nemlineáris modell
- Regressziós fák és splines
Unsupervised Learning
- Clusterelési technikák: k-means, k-medoids, hierarchikus clusterelés, SOMs
- Dimenziócsökkenés: PCA, tényezőelemzés, SVD
- Sokdimenziós skálázás
Szövegbányászat
- Szövegek előfeldolgozása és tokenezés
- Bag-of-words, tőszó, és lemmatizálás
- Érzéselemzés és szójelforgalom
- Szövegadatok vizualizálása szójelmélet-ködyökkel
Javaslatszisztémák
- Felhasználói és tárgyi alapú együttműködő szűrő
- Javaslatmotorok tervezése és értékelése
Associációs Mintázatbányászat
- Gyakori elemek halmazai és Apriori algoritmus
- Vásárlókosár elemzés és lift arány
Kilógó Értékek Felismerése
- Extremérték elemzés
- Távolság alapú és sűrűség alapú módszerek
- Kilógó értékek felismerése magasdimenziós adatokban
Machine Learning Esettanulmány
- Az üzleti probléma megértése
- Adatok előfeldolgozása és jellemzők kialakítása
- Modellkiválasztás és paraméterfinomítás
- Értékelés és eredmények bemutatása
- Telepítés
Összefoglalás és Következő Lépések
Követelmények
- Az estadisztika és a lineáris algebra alapismeretei
- Ismeret az adatanalitika vagy a business intelligence koncepciókban
- Valamely programozási nyelvek (legjobb, ha Python vagy R) ismerete ajánlott
- Érdeklődés az alkalmazott gépi tanulás megismerése iránt adatokból vezérelt projektekhez
Célközönség
- Adat-analitikák és tudósok
- Statisztikusok és kutatók
- Fejlesztők és IT szakemberek, akik a gépi tanulás eszközeit vizsgálják
- Bárki, aki az adattudomány vagy a prediktív analitika projektekben van
Vélemények (3)
Még akkor is, ha egy napi hiányozásom volt ügyféltalálkozók miatt, érzem, hogy jobban megértettem az Machine Learning folyó elképzelések és technikák használatát, és mikor választhatok az egyik megoldást a másik felett. Mostani feladatunk az, hogy gyakoroljuk, amit megtanultunk, és kezdjük el alkalmazni problémakörünkre.
Richard Blewett - Rock Solid Knowledge Ltd
Kurzus - Machine Learning – Data science
Gépi fordítás
I like that the training was focused on examples and coding. I thought it was impossible to pack so much content into three days of training, but I was wrong. The training covered many topics and everything was done in a very detailed manner (especially the tuning of the model's parameters - I didn't expect that there would be time for this and I was greatly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
Gépi fordítás
A sokféle módszerrel és előre elkészített szkripttel mutat be - nagyon jól elkészített anyagokkal és könnyen követhető folyamatokkal.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Kurzus - Machine Learning – Data science
Gépi fordítás