Kurzusleírás
Bevezetés
Ez a rész általánosan bemutatja, hogy mikor kell használni a „gépi tanulást”, mit kell figyelembe venni, és mit jelent mindez, beleértve az előnyöket és hátrányokat. Adattípusok (strukturált/strukturálatlan/statikus/streamelt), adatérvényesség/térfogat, adatvezérelt vs felhasználóvezérelt elemzés, statisztikai modellek vs. gépi tanulási modellek/ a nem felügyelt tanulás kihívásai, torzítás-variancia kompromisszum, iteráció/kiértékelés, keresztellenőrzési megközelítések , felügyelt/felügyelet nélkül/megerősítés.
FŐ TÉMÁK
1. A naiv Bayes megértése
- Bayesi módszerek alapfogalmai
- Valószínűség
- Együttes valószínűség
- Feltételes valószínűség Bayes-tétellel
- A naiv Bayes-algoritmus
- A naiv Bayes-besorolás
- A Laplace-becslő
- Numerikus jellemzők használata naiv Bayes-szel
2. A döntési fák megértése
- Oszd meg és uralkodj
- A C5.0 döntési fa algoritmus
- A legjobb felosztás kiválasztása
- A döntési fa metszése
3. Neurális hálózatok megértése
- A biológiaitól a mesterséges neuronokig
- Aktiválási funkciók
- Hálózati topológia
- A rétegek száma
- Az információ utazásának iránya
- Az egyes rétegekben található csomópontok száma
- Neurális hálózatok képzése visszaterjesztéssel
- Deep Learning
4. A támogató vektorgépek megértése
- Osztályozás hipersíkokkal
- A maximális margó megkeresése
- Lineárisan elválasztható adatok esete
- A nem lineárisan elkülöníthető adatok esete
- Kernelek használata nemlineáris terekhez
5. A klaszterezés megértése
- A klaszterezés, mint gépi tanulási feladat
- A klaszterezés k-közép algoritmusa
- Távolság használata fürtök hozzárendeléséhez és frissítéséhez
- A megfelelő számú klaszter kiválasztása
6. A teljesítmény mérése az osztályozáshoz
- Osztályozási előrejelzési adatokkal való munka
- A zavaros mátrixok közelebbi pillantása
- Zavarmátrixok használata a teljesítmény mérésére
- A pontosságon túl – a teljesítmény egyéb mértékei
- A kappa statisztika
- Érzékenység és specifitás
- Precizitás és felidézés
- Az F-mérték
- A teljesítmény kompromisszumainak megjelenítése
- ROC görbék
- A jövőbeli teljesítmény becslése
- A kitartási módszer
- Keresztellenőrzés
- Bootstrap mintavétel
7. A részvénymodellek hangolása a jobb teljesítmény érdekében
- A caret használata az automatikus paraméterhangoláshoz
- Egyszerűen hangolt modell készítése
- A hangolási folyamat testreszabása
- A modell teljesítményének javítása meta-learning segítségével
- Az együttesek megértése
- Zsákolás
- Fellendítés
- Véletlen erdők
- Véletlenszerű erdők képzése
- Véletlenszerű erdőteljesítmény értékelése
KISEBB TÉMÁK
8. Az osztályozás megértése a legközelebbi szomszédok segítségével
- A kNN algoritmus
- Távolság számítása
- A megfelelő k kiválasztása
- Adatok előkészítése a kNN-nel való használatra
- Miért lusta a kNN algoritmus?
9. Az osztályozási szabályok megértése
- Elkülönülni és hódítani
- Az Egy szabály algoritmusa
- A RIPPER algoritmus
- Szabályok a döntési fákból
10. A regresszió megértése
- Egyszerű lineáris regresszió
- Közönséges legkisebb négyzetek becslése
- Összefüggések
- Többszörös lineáris regresszió
11. Regressziós fák és modellfák megértése
- Regresszió hozzáadása a fákhoz
12. Társulási szabályok megértése
- Az Apriori algoritmus asszociációs szabályok tanulására
- A szabály érdeklődésének mérése – támogatás és bizalom
- Szabályrendszer felépítése az Apriori elv alapján
Extrák
- Spark/PySpark/MLlib és többkarú banditák
Vélemények (5)
Legyen rövid és egyszerű. Intuíciós és vizuális modellek létrehozása a fogalmak köré (döntési fa grafikonja, lineáris egyenletek, y_pred manuális kiszámítása a modell működésének bizonyítására).
Nicolae - DB Global Technology
Kurzus - Machine Learning
Gépi fordítás
Segített elérni a célomat, az ML megértését. Nagy tisztelet Pablo-nak, hogy megfelelő bevezetőt adott ebben a témában, hiszen 3 napos tréning után nyilvánvalóvá válik, hogy milyen hatalmas ez a téma. NAGYON élveztem az általad biztosított virtuális gépek ötletét is, amelyeknek nagyon jó késleltetése volt! Lehetővé tette, hogy minden kurzus a saját tempójában végezzen kísérleteket.
Silviu - DB Global Technology
Kurzus - Machine Learning
Gépi fordítás
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Kurzus - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Kurzus - Machine Learning
I liked the lab exercises.