Lépjen kapcsolatba velünk

Kurzusleírás

Bevezetés

Ez a rész általános bevezetést nyújt arról, hogy mikor érdemes gépi tanulást alkalmazni, mire kell figyelni, és mit is jelent mindez, beleértve az előnyöket és hátrányokat. Adattípusok (strukturált/struktúrálatlan/statikus/streames), adatok érvényessége/mennyisége, adatvezérelt vs. felhasználóvezérelt elemzés, statisztikai modellek vs. gépi tanulási modellek/a felügyelet nélküli tanulás kihívásai, bias-variancia kompromisszum, iteráció/értékelés, keresztvalidációs módszerek, felügyelt/felügyelet nélküli/megerősítéses tanulás.

FŐ TÉMÁK

1. A naiv Bayes megértése

  • A Bayes-módszerek alapfogalmai
  • Valószínűség
  • Közös valószínűség
  • Feltételes valószínűség a Bayes-tétellel
  • A naiv Bayes algoritmus
  • A naiv Bayes osztályozás
  • A Laplace-becslő
  • Numerikus jellemzők használata a naiv Bayesban

2. A döntési fák megértése

  • Oszd meg és uralkodj
  • A C5.0 döntési fa algoritmus
  • A legjobb felosztás kiválasztása
  • A döntési fa nyesése

3. A neurális hálózatok megértése

  • A biológiai neuróntól a mesterséges neuronig
  • Aktivációs függvények
  • Hálózati topológia
  • A rétegek száma
  • Az információ áramlásának iránya
  • A rétegekben lévő csomópontok száma
  • Neurális hálózatok tanítása visszaterjesztéssel
  • Mélytanulás

4. A támogató vektorgépek megértése

  • Osztályozás hipersíkokkal
  • A maximális margó megtalálása
  • A lineárisan szeparábilis adatok esete
  • A nem lineárisan szeparábilis adatok esete
  • Kernel használata nem lineáris terekben

5. A klaszterezés megértése

  • Klaszterezés mint gépi tanulási feladat
  • A k-means algoritmus klaszterezésre
  • Távolság használata klaszterek hozzárendeléséhez és frissítéséhez
  • A megfelelő klaszterek számának kiválasztása

6. Teljesítménymérés osztályozásnál

  • Osztályozási előrejelzési adatok kezelése
  • Részletesebb betekintés a zavarmátrixokba
  • Zavarmátrixok használata teljesítménymérésre
  • A pontosságon túl – egyéb teljesítménymutatók
  • A kappa statisztika
  • Érzékenység és specificitás
  • Pontosság és visszahívás
  • Az F-mérték
  • Teljesítménykompromisszumok vizualizálása
  • ROC görbék
  • Jövőbeli teljesítmény becslése
  • A tartalékmódszer
  • Keresztvalidáció
  • Bootstrap mintavételezés

7. Részvénymodellek finomhangolása jobb teljesítményért

  • A caret használata automatizált paraméterhangoláshoz
  • Egyszerű finomhangolt modell létrehozása
  • A hangolási folyamat testreszabása
  • Modell teljesítmény javítása meta-tanulással
  • Az együttesek megértése
  • Bagging
  • Boosting
  • Véletlen erdők
  • Véletlen erdők tanítása
  • Véletlen erdők teljesítményének értékelése

KISEBB TÉMÁK

8. Osztályozás megértése a legközelebbi szomszédok módszerével

  • A kNN algoritmus
  • Távolság számítása
  • Megfelelő k kiválasztása
  • Adatok előkészítése a kNN használatához
  • Miért lusta a kNN algoritmus?

9. Osztályozási szabályok megértése

  • Válassz szét és uralkodj
  • Az One Rule algoritmus
  • A RIPPER algoritmus
  • Szabályok döntési fákból

10. Regresszió megértése

  • Egyszerű lineáris regresszió
  • Legkisebb négyzetek módszere
  • Korrelációk
  • Többszörös lineáris regresszió

11. Regressziós fák és modellfák megértése

  • Regresszió hozzáadása fához

12. Szabályasszociációk megértése

  • Az Apriori algoritmus szabályasszociáció tanulásához
  • Szabály érdeklődés mérése – támogatás és bizalom
  • Szabálykészlet építése az Apriori elvvel

Extrák

  • Spark/PySpark/MLlib és Multi-armed bandits

Követelmények

Python ismeret

 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (7)

Közelgő kurzusok

Rokon kategóriák