Kurzusleírás

Bevezetés

Ez a rész általánosan bemutatja, hogy mikor kell használni a „gépi tanulást”, mit kell figyelembe venni, és mit jelent mindez, beleértve az előnyöket és hátrányokat. Adattípusok (strukturált/strukturálatlan/statikus/streamelt), adatérvényesség/térfogat, adatvezérelt vs felhasználóvezérelt elemzés, statisztikai modellek vs. gépi tanulási modellek/ a nem felügyelt tanulás kihívásai, torzítás-variancia kompromisszum, iteráció/kiértékelés, keresztellenőrzési megközelítések , felügyelt/felügyelet nélkül/megerősítés.

FŐ TÉMÁK

1. A naiv Bayes megértése

  • Bayes módszerek alapfogalmai
  • Valószínűség
  • Közös valószínűség
  • Feltételes valószínűség Bayes-tétel alapján
  • A naiv Bayes algoritmus
  • A naiv Bayes osztályozás
  • A Laplace becslő
  • Numerikus jellemzők használata a naiv Bayes-el

2. A döntési fák megértése

  • Osztás és uralkodás
  • A C5.0 döntési fa algoritmus
  • A legjobb szétválasztás kiválasztása
  • A döntési fa visszavágása

3. Neurális hálózatok megértése

  • Biológiai és mesterséges neuronok
  • Aktiválási függvények
  • Hálózati topológia
  • A rétegek száma
  • A tájékoztatás irányának
  • Minden rétegben lévő csomópontok száma
  • A neurális hálózatok backpropagationnal történő kiképzése
  • Deep Learning

4. A támogató vektorgépek megértése

  • Osztályozás hiperplánezzel
  • A legnagyobb határkeresés
  • A lineárisan elkülöníthető adatok esete
  • A nem lineárisan elkülöníthető adatok esete
  • Nem lineáris térbeli magok használata

5. A klaszterezés megértése

  • A klaszterezés gépi tanulásként
  • A k-means klaszterezési algoritmus
  • A távolság használata a klaszterek hozzárendelése és frissítése céljából
  • A megfelelő klaszterek számának kiválasztása

6. A teljesítmény mérése az osztályozáshoz

  • A klasszifikációs előrejelzési adatok használata
  • A konfúziós mátrixok részletes vizsgálata
  • A teljesítmény méréséhez használt konfúziós mátrixok
  • A pontosságnál túlmutató teljesítmény mérési módszerek
  • A kappa-statisztika
  • Érzékenység és specifikusság
  • Pontosság és teljesítés
  • Az F-mérték
  • A teljesítménykompromisszumok vizualizálása
  • ROC-görbék
  • A jövőbeli teljesítmény becslése
  • A tartalékos módszer
  • Keresztellenőrzés
  • Bootstrap mintavétel

7. A részvénymodellek hangolása a jobb teljesítmény érdekében

  • A caret automatizált paraméterbeállításának használata
  • A egyszerű beállított modell létrehozása
  • A beállítási folyamat testreszabása
  • A modell teljesítményének javítása meta-tanulással
  • A kollégiumok megértése
  • Csomagolás
  • Felfokozás
  • Vehés erdők
  • Vehés erdők kiképzése
  • A vehés erdők teljesítményének értékelése

KISEBB TÉMÁK

8. Az osztályozás megértése a legközelebbi szomszédok segítségével

  • A kNN algoritmus
  • A távolság számítása
  • Alkalmas k választása
  • Adatok előkészítése a kNN használatához
  • Miért nevetik a kNN algoritmust lazának?

9. Az osztályozási szabályok megértése

  • Elválasztás és uralkodás
  • Az Egy Szabály algoritmus
  • A RIPPER algoritmus
  • A döntési fákból származó szabályok

10. A regresszió megértése

  • Egyszerű lineáris regresszió
  • Legkisebb négyzetek becslése
  • Korrelációk
  • Többszörös lineáris regresszió

11. Regressziós fák és modellfák megértése

  • A fákhoz hozzáadott regresszió

12. Társulási szabályok megértése

  • Az Apriori algoritmus az társulási szabályok tanulásához
  • A szabályok érdeklődésének mérése – támogatás és bizalom
  • Egy szabályhalmaz létrehozása az Apriori elv alapján

Extrák

  • Spark/PySpark/MLlib és Multi-armed bandits

Követelmények

Python Knowledge

 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (7)

Közelgő kurzusok

Rokon kategóriák