Kurzusleírás
Modul 1: Alapvető Python ML munkafolyamatokhoz
• Kurzus indítása és környezet beállítása
Célok összehangolása és reprodukálható Python ML munkaterület beállítása
• Python nyelvi alapok (gyorstalpaló)
Szintaxis, vezérlési szerkezetek, függvények és ML kódokban gyakran használt minták áttekintése
• Adatszerkezetek ML-hez
Listák, szótárak, halmazok és tuple-ok a jellemzők, címkék és metaadatok kezeléséhez
• Listaértelmezések és funkcionális eszközök
Transzformációk kifejezése listaértelmezésekkel és magasabb rendű függvényekkel
• Objektum-orientált Python ML fejlesztőknek
Osztályok, metódusok, kompozíció és gyakorlati tervezési döntések
• dataclasses és könnyű modellezés
Típusos tárolók konfigurációk, példák és eredmények számára
• Dekorátorok és kontextuskezelők
Időmérés, gyorsítótár, naplózás és erőforrás-biztos végrehajtási minták
• Fájlok és útvonalak kezelése
Robusztus adathalmaz-kezelés és szerializációs formátumok
• Kivételek és védekező programozás
Biztonságosan és átláthatóan hibás ML szkriptek írása
• Modulok, csomagok és projektstruktúra
Újrafelhasználható ML kódok szervezése
• Típusozás és kódminőség
Típusjelölések, dokumentáció és lint-barát struktúra
Modul 2: Numerikus Python, SciPy és adatkezelés
• NumPy alapok vektorizált számításokhoz
Hatékony tömbműveletek és teljesítménytudatos kódolás
• Indexelés, szeletelés, sugárzás és alakzatok
Biztonságos tenzor kezelés és alakzatok értelmezése
• Lineáris algebra alapok NumPy és SciPy segítségével
Stabil mátrixműveletek és ML-ben használt felbontások
• SciPy mélyút
Statisztika, optimalizálás, görbeillesztés és ritka mátrixok
• Pandas táblázatos ML adatokhoz
Adattisztítás, összekapcsolás, aggregálás és adathalmazok előkészítése
• scikit-learn mélyút
Becslő interfész, folyamatok és reprodukálható munkafolyamatok
• Vizualizáció alapok
Diagnosztikai ábrák adatfeltáráshoz és modell viselkedéshez
Modul 3: Programozási minták ML alkalmazások építéséhez
• Notebooktól a karbantartható projekttig
Felfedező kód átalakítása strukturált csomagokká
• Konfigurációkezelés
Külső paraméterek és indítási ellenőrzés
• Naplózás, figyelmeztetések és megfigyelhetőség
Strukturált naplózás hibakereshető ML rendszerekhez
• Újrafelhasználható komponensek OOP és kompozícióval
Bővíthető transzformátorok és előrejelzők tervezése
• Gyakorlati tervezési minták
Folyamat, Gyár vagy Regiszter, Stratégia és Adapter minták
• Adatellenőrzés és séma ellenőrzések
Csendes adatproblémák megelőzése
• Teljesítmény és profilozás
Szűk keresztmetszetek azonosítása és optimalizációs technikák alkalmazása
• Modell I/O és következtetési interfészek
Biztonságos perzisztencia és tiszta előrejelzési interfészek
• Végpontok közötti mini felépítés
Termelési stílusú ML folyamat konfigurációval és naplózással
Modul 4: Statisztikai tanulás táblázatos, szöveges és képi adatokhoz
• Értékelés alapok
Tanuló és érvényesítési felosztások, őszinteséges kereszthivatkozás és üzleti célokhoz igazított metrikák
• Haladó táblázatos ML
Regularizált GLM-ek, faegyüttesek és szivárgásmentes előfeldolgozás
• Kalibrálás és bizonytalanság
Platt skálázás, izotónikus regresszió, bootstrap és konformális előrejelzés
• Klasszikus NLP módszerek
Tokenizálási kompromisszumok, TF-IDF, lineáris modellek és Naive Bayes
• Témamodellezés
LDA alapok és gyakorlati korlátok
• Klasszikus számítógépes látás
HOG, PCA és jellemzőalapú folyamatok
• Hibaanálízis
Elfogultság észlelése, címke zaj és hamis korrelációk
• Gyakorlati laborok
Szivárgásmentes táblázatos folyamat
Szöveges alapvonal összehasonlítás és értelmezés
Klasszikus látás alapvonal strukturált hibaanálízissel
Modul 5: Neurális hálózatok táblázatos, szöveges és képi adatokhoz
• Tanulási ciklus mesterfokozat
Tiszta PyTorch ciklusok AMP, klippelés és reprodukálhatósággal
• Optimalizálás és regularizálás
Inicializálás, normalizálás, optimalizálók és ütemezők
• Vegyes pontosság és skálázás
Gradiens akkumuláció és ellenőrzőpontozási stratégiák
• Táblázatos neurális hálózatok
Kategorikus beágyazások, jellemző keresztezések és abláció tanulmányok
• Szöveges neurális hálózatok
Beágyazások, CNN-ek, BiLSTM vagy GRU és szekvencia kezelés
• Látás neurális hálózatok
CNN alapok és ResNet-stílusú architektúrák
• Gyakorlati laborok
Újrafelhasználható tanulási keretrendszer
Táblázatos NN vs boosting összehasonlítás
CNN erősítéssel és ütemezési kísérletekkel
Modul 6: Haladó Neurális Architektúrák
• Transfer tanulási stratégiák
Fagyasztás és kifagyasztás minták, diszkriminatív tanulási ráták
• Transzformer architektúrák szövegekhez
Önmegfigyelés belső részei és finomhangolási módszerek
• Látás alapok és sűrű előrejelzés
ResNet, EfficientNet, Vision Transzformerek és U-Net koncepciók
• Haladó táblázatos architektúrák
TabTransformer, FT-Transformer és Deep and Cross hálózatok
• Idősorokkal kapcsolatos szempontok
Időbeli felosztások és kovariáns eltolódás észlelése
• PEFT és hatékonysági technikák
LoRA, desztilláció és kvantálási kompromisszumok
• Gyakorlati laborok
Előre tanított szöveg transzformer finomhangolása
Előre tanított látás modell finomhangolása
Táblázatos transzformer vs GBDT összehasonlítás
Modul 7: Generatív AI Rendszerek
• Promptolás alapok
Strukturált promptolás és kontrollált generálás
• LLM alapok
Tokenizálás, utasítás finomhangolás és hallucináció csökkentés
• Retrieval-Augmented Generation
Darabolás, beágyazások, hibrid keresés és értékelési metrikák
• Finomhangolási stratégiák
LoRA és QLoRA adatminőség-ellenőrzéssel
• Diffúziós modellek
Latens diffúzió intuíció és gyakorlati adaptáció
• Szintetikus táblázatos adatok
CTGAN és adatvédelmi szempontok
• Gyakorlati laborok
Termelési stílusú RAG mini alkalmazás
Strukturált kimenet ellenőrzés sémavégrehajtással
Opcionális diffúziós kísérletezés
Modul 8: AI Agensek és MCP
• Agent ciklus tervezés
Megfigyelés, tervezés, cselekvés, reflexió és perzisztencia
• Agent architektúrák
ReAct, tervezés-és-végrehajtás és több agent koordináció
• Memóriakezelés
Epizodikus, szemantikus és vázlatkönyv megközelítések
• Eszköz integráció és biztonság
Eszköz szerződések, homokozás és prompt injekció elleni védelem
• Értékelési keretrendszerek
Visszajátszható nyomok, feladatsorok és regressziós tesztelés
• MCP és protokollalapú együttműködés
MCP szerverek tervezése biztonságos eszköz kiállítással
• Gyakorlati laborok
Agent építése nulláról
Eszközök kiállítása MCP-stílusú szerveren keresztül
Értékelési keretrendszer létrehozása biztonsági korlátozásokkal
Követelmények
A résztvevőknek rendelkezniük kell Python programozási ismeretekkel.
Ez a program középhaladó és haladó szintű szakembereknek szól.
Vélemények (2)
az ML-ekoszisztéma nem csak az MLFlow-t, hanem az Optunát, a HyperOps-t, valamint a Docker-t és a Docker-Compose-t is tartalmazza
Guillaume GAUTIER - OLEA MEDICAL
Kurzus - MLflow
Gépi fordítás
Nagyezték, hogy részese lehettem a Kubeflow tanfolyamnak, amelyet távollértű módon tartottak. A képzés lehetővé tette számomra, hogy megalapozzam az AWS-szal kapcsolatos ismereteimet, a K8s-t és a Kubeflow környezetében használt minden devOps eszköz alapjait, amelyek a témakör megfelelő felépítéséhez szükségesek. Szeretném köszönetet mondani Malawski Marcinnek az általa tanúsított türelmért és professzionális eljárásokért a képzés során és a legjobb gyakorlati tanácsokért. Malawski számos különböző szempontból közelítette meg a témát, különböző üzembe helyezési eszközökkel, mint például az Ansible, EKS kubectl és a Terraform. Most már egyértelműen meggyőződtem arról, hogy a megfelelő alkalmazási területre haladszom.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Kurzus - Kubeflow
Gépi fordítás