Kurzusleírás

Bevezetés a gépi tanulásba

  • A gépi tanulás típusai – felügyelt vs felügyelet nélküli
  • A statisztikai tanulástól a gépi tanulásig
  • Az adatbányászat munkafolyamata: üzleti megértés, adatelőkészítés, modellezés, üzembe helyezés
  • A megfelelő algoritmus kiválasztása a feladathoz
  • Túltanulás és a bias-variancia kompromisszum

Python és ML könyvtárak áttekintése

  • Miért használjunk programozási nyelveket gépi tanuláshoz
  • Választás R és Python között
  • Python gyorstalpaló és Jupyter Notebooks
  • Python könyvtárak: pandas, NumPy, scikit-learn, matplotlib, seaborn

ML algoritmusok tesztelése és értékelése

  • Általánosítás, túltanulás és modellvalidáció
  • Értékelési stratégiák: holdout, kereszthasítás, bootstrapping
  • Metrikák regresszióhoz: ME, MSE, RMSE, MAPE
  • Metrikák osztályozáshoz: pontosság, zavarmátrix, kiegyensúlyozatlan osztályok
  • Modellteljesítmény vizualizációja: nyereséggörbe, ROC-görbe, lift-görbe
  • Modellkiválasztás és rácsos keresés a finomhangoláshoz

Adatelőkészítés

  • Adatok importálása és tárolása Pythonban
  • Exploratív elemzés és összefoglaló statisztikák
  • Hiányzó értékek és kiugró értékek kezelése
  • Standardizálás, normalizálás és transzformáció
  • Minőségi adatok újrakódolása és adatápolás pandas segítségével

Osztályozó algoritmusok

  • Bináris vs többosztályos osztályozás
  • Logisztikus regresszió és diszkrimináns függvények
  • Naív Bayes, k-legközelebbi szomszédok
  • Döntési fák: CART, Véletlen Erdők, Bagging, Boosting, XGBoost
  • Támogató vektorgépek és magfüggvények
  • Együttes tanulási technikák

Regresszió és numerikus előrejelzés

  • Legkisebb négyzetek és változóválasztás
  • Regularizációs módszerek: L1, L2
  • Polinomiális regresszió és nemlineáris modellek
  • Regressziós fák és spline-ok

Neurális hálózatok

  • Bevezetés a neurális hálózatokba és a mélytanulásba
  • Aktivációs függvények, rétegek és visszaterjesztés
  • Többrétegű perceptronok (MLP)
  • TensorFlow vagy PyTorch használata alapvető neurális hálózati modellezéshez
  • Neurális hálózatok osztályozásra és regresszióra

Értékesítési előrejelzés és prediktív analitika

  • Idősorok vs regresszió alapú előrejelzés
  • Szezonális és trendalapú adatok kezelése
  • Értékesítési előrejelzési modell építése gépi tanulási technikákkal
  • Előrejelzési pontosság és bizonytalanság értékelése
  • Üzleti értelmezés és eredmények kommunikációja

Felügyelet nélküli tanulás

  • Klaszterezési technikák: k-közép, k-medoids, hierarchikus klaszterezés, SOMs
  • Dimenziócsökkentés: PCA, faktoranalízis, SVD
  • Többdimenziós skálázás

Szövegbányászat

  • Szöveg előfeldolgozás és tokenizálás
  • Szóhalmaz, tövésítés és lemmatizálás
  • Hangulatelemzés és szógyakoriság
  • Szöveges adatok vizualizációja szófelhőkkel

Ajánlórendszerek

  • Felhasználó alapú és elem alapú együttműködő szűrés
  • Ajánlórendszerek tervezése és értékelése

Asszociációs mintázat bányászat

  • Gyakori elemhalmazok és Apriori algoritmus
  • Piaci kosár elemzés és lift arány

Kiugró értékek detektálása

  • Extrém érték elemzés
  • Távolság alapú és sűrűség alapú módszerek
  • Kiugró értékek detektálása magas dimenziós adatokban

Gépi tanulás esettanulmány

  • Az üzleti probléma megértése
  • Adat előfeldolgozás és jellemzőkészítés
  • Modell kiválasztás és paraméterek finomhangolása
  • Eredmények értékelése és bemutatása
  • Üzembe helyezés

Összefoglalás és következő lépések

Követelmények

  • Alapvető ismeretek a gépi tanulás alapfogalmairól, például a felügyelt és felügyelet nélküli tanulásról
  • Ismeretek a Python programozásban (változók, ciklusok, függvények)
  • Némi tapasztalat az adatkezelésben pandas vagy NumPy könyvtárak használatával hasznos, de nem szükséges
  • Nem szükséges előzetes tapasztalat haladó modellezéssel vagy neurális hálózatokkal

Közönség

  • Adattudósok
  • Üzleti elemzők
  • Szoftvermérnökök és adatokkal dolgozó technikai szakemberek
 28 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (2)

Közelgő kurzusok

Rokon kategóriák