Kurzusleírás
Machine Learning Bevezetés
- Gépies tanulás típusai – felügyelt vs. nem felügyelt
- A statisztikai tanulástól a gépi tanulásig
- A bányászati munkafolyamat: üzleti megértés, adatfeldolgozás, modellkészítés, telepítés
- A megfelelő algoritmus kiválasztása a feladathoz
- Túlillesztés és a bias-variance kompromisszum
Python és ML Könyvtárak Áttekintése
- Miért használjuk a programozási nyelveket ML-hez
- A választás R és Python között
- Python rövid áttekintés és Jupyter Notebooks
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML Algoritmusok Tesztelése és Értékelése
- Általánosítás, túlillesztés és modellvalidáció
- Értékelési stratégiák: holdout, keresztezett validáció, bootstrapping
- Regressziós mérték: ME, MSE, RMSE, MAPE
- Osztályozás mértéke: pontosság, összekeverés mátrix, egyensúlytalan osztályok
- Modell teljesítmény vizualizációja: profit görbe, ROC görbe, lift görbe
- Modell kiválasztás és grid search beállítása
Adatfeldolgozás
- Adatimport és tárolás Python-ban
- Feltáró elemzés és összegező statisztika
- Hiányzó értékek és kivételes értékek kezelése
- Standardizálás, normalizálás és transzformáció
- Kvalitatív adat átalakítás és adatok manipulálása pandas-szal
Osztályozási Algoritmusok
- Bináris vs. többosztályú osztályozás
- Logisztikus regresszió és differenciálfüggvények
- Naïve Bayes, k legközelebbi szomszédok
- Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines és kernelek
- Együttműködési tanulási technikák
Regresszió és Számos Vorhálózás
- Legkisebb négyzetek és változó kiválasztás
- Regularizálási módszerek: L1, L2
- Polynomial regresszió és nemlineáris modellek
- Regressziós fák és spline-k
Neural Networks
- A neurális hálózatok és mély tanulás bevezetése
- Aktiválási függvények, rétegek és visszaterjesztés
- Multilayer perceptrons (MLP)
- TensorFlow vagy PyTorch használata alapszintű neurális hálózat modellkészítéshez
- Neurális hálózatok osztályozáshoz és regresszióhoz
Eladás Forecasting és Predictive Analytics
- Idősor vs. regresszió alapú előrejelzés
- Szezonális és trend alapú adat kezelése
- Eladási előrejelzési modell készítése ML technikák használatával
- Előrejelzési pontosság és bizonytalanság értékelése
- Business értelmezése és eredményeinek kommunikálása
Unsupervised Learning
- Cluster technikák: k-means, k-medoids, hierarchikus cluster, SOMs
- Dimenziális redukció: PCA, faktoranalízis, SVD
- Multidimenziós skalázás
Szövegbányászat
- Szövegfeldolgozás és tokenizáció
- Bag-of-words, szótők és lemmatizáció
- Érzékelésanalízis és szógyakoriság
- Szöveges adat vizualizálása szófelhők segítségével
Javasolási Rendszerek
- Felhasználói és tárgy alapú együttműködő szűrés
- Javasolási motorok tervezése és értékelése
Associációs Minta Bányászat
- Gyakori elemek és Apriori algoritmus
- Piackosár elemzés és lift arány
Kivételes Értékek Értékelése
- Extreme érték elemzés
- Távolság és sűrűség alapú módszerek
- Kivételes érték detektálása magas dimenziós adatokban
Machine Learning Eseményjegyzék
- Az üzleti probléma megértése
- Adatfeldolgozás és jellemzők tervezése
- Modell kiválasztás és paraméterbeállítás
- Értékelés és találatok bemutatása
- Telepítés
Összegzés és Következő lépések
Követelmények
- Alapvető ismeretek a gépi tanulás fogalmai, például felügyelt és felügyelt nélküli tanulás
- Python programozás ismerete (változók, ciklusok, függvények)
- A pandas vagy NumPy könyvtárak használatával történő adatok kezelésének valamilyen tapasztalata hasznos, de nem kötelező
- Nincs szükség előzetes tapasztalatra előrehaladott modellalkodással vagy neuronhálókkal
Célközönség
- Adat tudósok
- Business analitikák
- Adatokat kezelő szoftvermérnökök és technikai szakemberek
Vélemények (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kurzus - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.