Kurzusleírás
Gépezeti Tanulás Bevezetés
- Gépezeti tanulás típusai – felügyelt vs. fel nem ügyelt
- A statisztikai tanulástól a gépezeti tanulásig
- Az adattárolás munkafolyamata: üzleti megértés, adatok előkészítése, modellkészítés, bevezetés
- A megfelelő algoritmus választása a feladathoz
- Tulajdonoskodás és a bias-variance kompromisszum
Python és ML Könyvtárak Áttekintése
- Miért használjuk a programozási nyelveket ML-hez
- Választás R és Python között
- Python gyorskurszus és Jupyter Notebookok
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
Gépezeti Tanulási Algoritmusok Tesztelése és Értékelése
- Generalizálás, túltanulás és modell validálása
- Értékelő stratégiák: holdout, keresztvalidálás, bootstrapping
- Metrikák regresszióhoz: ME, MSE, RMSE, MAPE
- Metrikák osztályozáshoz: pontosság, összekeverési mátrix, nem egyensúlyos osztályok
- Modell teljesítmény vizualizálása: profit görbe, ROC görbe, lift görbe
- Modell kiválasztás és grid search finomításhoz
Adatok Előkészítése
- Adatok importálása és tárolása Pythonban
- Kutatási elemzés és összegező statisztikák
- Hiányzó értékek és kivételes értékek kezelése
- Szabványosítás, normalizálás és átalakítás
- Kvalitatív adatok átkódolása és adatok kezelése pandas-al
Osztályozási Algoritmusok
- Bináris vs. többosztályos osztályozás
- Logisztikai regresszió és diszkrimináns függvények
- Naïve Bayes, k-legközelebbi szomszéd
- Döntési fák: CART, Random Forests, Bagging, Boosting, XGBoost
- Támogató vektor gépek és kernel-ek
- Együttes tanulási technikák
Regresszió és Számtani Előrejelzés
- Legkisebb négyzetek és változó választás
- Regularizációs módszerek: L1, L2
- Polinom regresszió és nemlineáris modell
- Regressziós fák és splines
Neuronhálózatok
- Bevezetés a neuronhálózatokba és mélységi tanulásba
- Aktíválási függvények, rétegek és visszafelé terjedő propagáció
- Többrétegű perceptronok (MLP)
- TensorFlow vagy PyTorch használata alapos neuronhálózat modellkészítéshez
- Neuronhálózatok osztályozáshoz és regresszióhoz
Eladó Előrejelzés és Előrejelző Analitika
- Idősorozatos vs. regresszió alapú előrejelzés
- Szezonális és trend alapú adatok kezelése
- Eladó előrejelző modell készítése ML technikákkal
- Előrejelzés pontoságának és bizonytalanságának értékelése
- Üzleti értelmezés és eredmények kommunikálása
Fel nem Ügyelt Tanulás
- Csoportosítási technikák: k-means, k-medoid, hierarchikus csoportosítás, SOM-ok
- Dimenziócsökkentés: PCA, faktoranalízis, SVD
- Többdimenziós skálázás
Szövegek Bányászata
- Szövegek előkészítése és tokenizálása
- Szócsomag, származékok és alaktani alakok
- Érzésteljes elemzés és szógyakoriság
- Szöveges adatok vizualizálása szófelhőkkel
Ajánló Rendszerek
- Felhasználó alapú és tárgy alapú együttműködő szűrők
- Ajánló motorok tervezése és értékelése
Asszociációs Mintázat Bányászata
- Gyakori elemek halmazai és Apriori algoritmus
- Piaci kosár elemzés és lift arány
Kivétel Érzékelés
- Extremumérték elemzés
- Táv és sűrűség alapú módszerek
- Kivétel érzékelés magas dimenziós adatokban
Gépezeti Tanulás Esettanulmány
- Üzleti problémák megértése
- Adatok előkészítése és jellemzőmérés
- Modell kiválasztás és paraméter finomítása
- Eredmények értékelése és bemutatása
- Bevezetés
Összegzés és Következő Lépések
Követelmények
- Gépesített tanulás alapelveinek ismerete, például felügyelt és fel nem ügyelt tanulás
- Ismeret a Python programozással (változók, ciklusok, függvények)
- Segít, de nem kötelező, ha van tapasztalata adatok kezelésével pandas vagy NumPy könyvtárak használatával
- Nem várunk előzetes tapasztalatot előrehaladott modellelés vagy neurális hálózatok használatával
Célközönség
- Adattudósok
- Üzleti elemzők
- Szoftvermérnökök és technikai szakemberek, akik adatokkal dolgoznak
Vélemények (2)
Az ML ekoszisztéma nem csak MLFlow-t, hanem Optuna, hyperops, docker és docker-compose is tartalmazza.
Guillaume GAUTIER - OLEA MEDICAL
Kurzus - MLflow
Gépi fordítás
I élveztem a részvételt a Kubeflow képzésen, amelyet távolról tartottak. Ez a képzés lehetővé tette számomra, hogy megfossam az AWS szolgáltatások, a K8s, és az összes Kubeflow-hoz tartozó devOps eszköz ismereteit, amelyek a tárgy megfelelő megközelítéséhez szükségesek. Köszönöm Malawski Marcinnek a kitartását és a szakmai hozzáállását a képzés és a legjobb gyakorlatok tanácsai során. Malawski különböző szempontokból közelíti meg a tárgyat, különböző telepítési eszközök Ansible, EKS kubectl, Terraform. Most biztos vagyok benne, hogy a megfelelő alkalmazási területre léptek.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurzus - Kubeflow
Gépi fordítás