Kurzusleírás
Bevezetés a gépi tanulásba
- A gépi tanulás típusai – felügyelt vs felügyelet nélküli
- A statisztikai tanulástól a gépi tanulásig
- Az adatbányászat munkafolyamata: üzleti megértés, adatelőkészítés, modellezés, üzembe helyezés
- A megfelelő algoritmus kiválasztása a feladathoz
- Túltanulás és a bias-variancia kompromisszum
Python és ML könyvtárak áttekintése
- Miért használjunk programozási nyelveket gépi tanuláshoz
- Választás R és Python között
- Python gyorstalpaló és Jupyter Notebooks
- Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn
ML algoritmusok tesztelése és értékelése
- Általánosítás, túltanulás és modellvalidáció
- Értékelési stratégiák: holdout, kereszthasítás, bootstrapping
- Metrikák regresszióhoz: ME, MSE, RMSE, MAPE
- Metrikák osztályozáshoz: pontosság, zavarmátrix, kiegyensúlyozatlan osztályok
- Modellteljesítmény vizualizációja: nyereséggörbe, ROC-görbe, lift-görbe
- Modellkiválasztás és rácsos keresés a finomhangoláshoz
Adatelőkészítés
- Adatok importálása és tárolása Pythonban
- Exploratív elemzés és összefoglaló statisztikák
- Hiányzó értékek és kiugró értékek kezelése
- Standardizálás, normalizálás és transzformáció
- Minőségi adatok újrakódolása és adatápolás pandas segítségével
Osztályozó algoritmusok
- Bináris vs többosztályos osztályozás
- Logisztikus regresszió és diszkrimináns függvények
- Naív Bayes, k-legközelebbi szomszédok
- Döntési fák: CART, Véletlen Erdők, Bagging, Boosting, XGBoost
- Támogató vektorgépek és magfüggvények
- Együttes tanulási technikák
Regresszió és numerikus előrejelzés
- Legkisebb négyzetek és változóválasztás
- Regularizációs módszerek: L1, L2
- Polinomiális regresszió és nemlineáris modellek
- Regressziós fák és spline-ok
Neurális hálózatok
- Bevezetés a neurális hálózatokba és a mélytanulásba
- Aktivációs függvények, rétegek és visszaterjesztés
- Többrétegű perceptronok (MLP)
- TensorFlow vagy PyTorch használata alapvető neurális hálózati modellezéshez
- Neurális hálózatok osztályozásra és regresszióra
Értékesítési előrejelzés és prediktív analitika
- Idősorok vs regresszió alapú előrejelzés
- Szezonális és trendalapú adatok kezelése
- Értékesítési előrejelzési modell építése gépi tanulási technikákkal
- Előrejelzési pontosság és bizonytalanság értékelése
- Üzleti értelmezés és eredmények kommunikációja
Felügyelet nélküli tanulás
- Klaszterezési technikák: k-közép, k-medoids, hierarchikus klaszterezés, SOMs
- Dimenziócsökkentés: PCA, faktoranalízis, SVD
- Többdimenziós skálázás
Szövegbányászat
- Szöveg előfeldolgozás és tokenizálás
- Szóhalmaz, tövésítés és lemmatizálás
- Hangulatelemzés és szógyakoriság
- Szöveges adatok vizualizációja szófelhőkkel
Ajánlórendszerek
- Felhasználó alapú és elem alapú együttműködő szűrés
- Ajánlórendszerek tervezése és értékelése
Asszociációs mintázat bányászat
- Gyakori elemhalmazok és Apriori algoritmus
- Piaci kosár elemzés és lift arány
Kiugró értékek detektálása
- Extrém érték elemzés
- Távolság alapú és sűrűség alapú módszerek
- Kiugró értékek detektálása magas dimenziós adatokban
Gépi tanulás esettanulmány
- Az üzleti probléma megértése
- Adat előfeldolgozás és jellemzőkészítés
- Modell kiválasztás és paraméterek finomhangolása
- Eredmények értékelése és bemutatása
- Üzembe helyezés
Összefoglalás és következő lépések
Követelmények
- Alapvető ismeretek a gépi tanulás alapfogalmairól, például a felügyelt és felügyelet nélküli tanulásról
- Ismeretek a Python programozásban (változók, ciklusok, függvények)
- Némi tapasztalat az adatkezelésben pandas vagy NumPy könyvtárak használatával hasznos, de nem szükséges
- Nem szükséges előzetes tapasztalat haladó modellezéssel vagy neurális hálózatokkal
Közönség
- Adattudósok
- Üzleti elemzők
- Szoftvermérnökök és adatokkal dolgozó technikai szakemberek
Vélemények (2)
az ML-ekoszisztéma nem csak az MLFlow-t, hanem az Optunát, a HyperOps-t, valamint a Docker-t és a Docker-Compose-t is tartalmazza
Guillaume GAUTIER - OLEA MEDICAL
Kurzus - MLflow
Gépi fordítás
Nagyezték, hogy részese lehettem a Kubeflow tanfolyamnak, amelyet távollértű módon tartottak. A képzés lehetővé tette számomra, hogy megalapozzam az AWS-szal kapcsolatos ismereteimet, a K8s-t és a Kubeflow környezetében használt minden devOps eszköz alapjait, amelyek a témakör megfelelő felépítéséhez szükségesek. Szeretném köszönetet mondani Malawski Marcinnek az általa tanúsított türelmért és professzionális eljárásokért a képzés során és a legjobb gyakorlati tanácsokért. Malawski számos különböző szempontból közelítette meg a témát, különböző üzembe helyezési eszközökkel, mint például az Ansible, EKS kubectl és a Terraform. Most már egyértelműen meggyőződtem arról, hogy a megfelelő alkalmazási területre haladszom.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurzus - Kubeflow
Gépi fordítás