Kurzusleírás
Machine Learning Bevezetés
- Gépies tanulás típusai – felügyelt vs. nem felügyelt
- A statisztikai tanulástól a gépi tanulásig
- A bányászati munkafolyamat: üzleti megértés, adatfeldolgozás, modellkészítés, telepítés
- A megfelelő algoritmus kiválasztása a feladathoz
- Túlillesztés és a bias-variance kompromisszum
Python és ML Könyvtárak Áttekintése
- Miért használjuk a programozási nyelveket ML-hez
- A választás R és Python között
- Python rövid áttekintés és Jupyter Notebooks
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML Algoritmusok Tesztelése és Értékelése
- Általánosítás, túlillesztés és modellvalidáció
- Értékelési stratégiák: holdout, keresztezett validáció, bootstrapping
- Regressziós mérték: ME, MSE, RMSE, MAPE
- Osztályozás mértéke: pontosság, összekeverés mátrix, egyensúlytalan osztályok
- Modell teljesítmény vizualizációja: profit görbe, ROC görbe, lift görbe
- Modell kiválasztás és grid search beállítása
Adatfeldolgozás
- Adatimport és tárolás Python-ban
- Feltáró elemzés és összegező statisztika
- Hiányzó értékek és kivételes értékek kezelése
- Standardizálás, normalizálás és transzformáció
- Kvalitatív adat átalakítás és adatok manipulálása pandas-szal
Osztályozási Algoritmusok
- Bináris vs. többosztályú osztályozás
- Logisztikus regresszió és differenciálfüggvények
- Naïve Bayes, k legközelebbi szomszédok
- Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines és kernelek
- Együttműködési tanulási technikák
Regresszió és Számos Vorhálózás
- Legkisebb négyzetek és változó kiválasztás
- Regularizálási módszerek: L1, L2
- Polynomial regresszió és nemlineáris modellek
- Regressziós fák és spline-k
Neural Networks
- A neurális hálózatok és mély tanulás bevezetése
- Aktiválási függvények, rétegek és visszaterjesztés
- Multilayer perceptrons (MLP)
- TensorFlow vagy PyTorch használata alapszintű neurális hálózat modellkészítéshez
- Neurális hálózatok osztályozáshoz és regresszióhoz
Eladás Forecasting és Predictive Analytics
- Idősor vs. regresszió alapú előrejelzés
- Szezonális és trend alapú adat kezelése
- Eladási előrejelzési modell készítése ML technikák használatával
- Előrejelzési pontosság és bizonytalanság értékelése
- Business értelmezése és eredményeinek kommunikálása
Unsupervised Learning
- Cluster technikák: k-means, k-medoids, hierarchikus cluster, SOMs
- Dimenziális redukció: PCA, faktoranalízis, SVD
- Multidimenziós skalázás
Szövegbányászat
- Szövegfeldolgozás és tokenizáció
- Bag-of-words, szótők és lemmatizáció
- Érzékelésanalízis és szógyakoriság
- Szöveges adat vizualizálása szófelhők segítségével
Javasolási Rendszerek
- Felhasználói és tárgy alapú együttműködő szűrés
- Javasolási motorok tervezése és értékelése
Associációs Minta Bányászat
- Gyakori elemek és Apriori algoritmus
- Piackosár elemzés és lift arány
Kivételes Értékek Értékelése
- Extreme érték elemzés
- Távolság és sűrűség alapú módszerek
- Kivételes érték detektálása magas dimenziós adatokban
Machine Learning Eseményjegyzék
- Az üzleti probléma megértése
- Adatfeldolgozás és jellemzők tervezése
- Modell kiválasztás és paraméterbeállítás
- Értékelés és találatok bemutatása
- Telepítés
Összegzés és Következő lépések
Követelmények
- Alapvető ismeretek a gépi tanulás fogalmai, például felügyelt és felügyelt nélküli tanulás
- Python programozás ismerete (változók, ciklusok, függvények)
- A pandas vagy NumPy könyvtárak használatával történő adatok kezelésének valamilyen tapasztalata hasznos, de nem kötelező
- Nincs szükség előzetes tapasztalatra előrehaladott modellalkodással vagy neuronhálókkal
Célközönség
- Adat tudósok
- Business analitikák
- Adatokat kezelő szoftvermérnökök és technikai szakemberek
Vélemények (2)
Az ML ekoszisztéma nem csak MLFlow-t, hanem Optuna, hyperops, docker és docker-compose is tartalmazza.
Guillaume GAUTIER - OLEA MEDICAL
Kurzus - MLflow
Gépi fordítás
I élveztem a részvételt a Kubeflow képzésen, amelyet távolról tartottak. Ez a képzés lehetővé tette számomra, hogy megfossam az AWS szolgáltatások, a K8s, és az összes Kubeflow-hoz tartozó devOps eszköz ismereteit, amelyek a tárgy megfelelő megközelítéséhez szükségesek. Köszönöm Malawski Marcinnek a kitartását és a szakmai hozzáállását a képzés és a legjobb gyakorlatok tanácsai során. Malawski különböző szempontokból közelíti meg a tárgyat, különböző telepítési eszközök Ansible, EKS kubectl, Terraform. Most biztos vagyok benne, hogy a megfelelő alkalmazási területre léptek.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurzus - Kubeflow
Gépi fordítás