Kurzusleírás

Gépi tanulás

Bevezetés a gépi tanulásba

  • Gépi tanulás alkalmazásai
  • Felügyelt és nem felügyelt tanulás összehasonlítása
  • Gépi tanulási algoritmusok
    • Regresszió
    • Klasszifikáció
    • Csoportosítás (clustering)
    • Javaslat rendszerek
    • Hibák észlelése
    • Felügyelet nélküli tanulás (reinforcement learning)

Regresszió

  • Egyszerű és többváltozós regresszió
    • Kisnézetes módszer
    • Becslések számítása a paraméterekre
    • A paraméterbecslések pontosságának becslése
    • A modell pontosságának becslése
    • Bevértek utáni elemzés
    • Egyéb fontandó szempontok a regressziós modellekben
    • Kategorikus előrejelzők
    • Lineáris modellek kiterjesztései
    • Megoldhatatlanságok
    • Hibás- és túlillesztés (under-fitting/over-fitting) a regressziós modellekben

Újrarétegelt módszerek

  • Keresztevalutáció
  • A validációs adatbázis megközelítése
  • Egy-kivételi keresztevalutáció (leave-one-out cross-validation)
  • k-darabos keresztevalutáció (k-fold cross-validation)
  • Hibás- és túlillesztés a k-darabos esetben
  • A bootstrap módszer

Modellválasztás és szabályozás

  • Alfajtó választás
    • A legjobb alfajtó kiválasztása
    • Lépésenkénti kiválasztás
    • A legoptimálisabb modell kiválasztása
  • Összehúzó módszer/szabályozás
    • Ridge regresszió
    • Lasso és Elastic Net
  • A szabályozási paraméter kiválasztása
  • Kvórumcsökkentő módszerek
    • Elsődleges komponensek regressziója (principal components regression)
    • Részletleges legkevesebb négyzetek (partial least squares)

Klasszifikáció

Logisztikus regresszió

  • A logisztikus modellek költségfunkciója
  • Becslések számítása a paraméterekre
  • Predikciók készítése
  • Tudatmeneti arány (odds ratio)
  • Mérőszempontok a teljesítmény értékeléséhez
    • Erzékenység/Specifikusság/Pozitív előrejelző érték/Negatív előrejelző érték (sensitivity/specificity/PPV/NPV)
    • Pontosság
    • ROC görbe
  • Többváltozós logisztikus regresszió
  • Logisztikus regresszió >2 válaszcsoport esetén
  • Szabályozott logisztikus regresszió

Lineáris diszkriminációs analízis (LDA)

  • A Bayes-tétel alkalmazása a klasszifikációhoz
  • Lineáris diszkriminációs analízis p=1 esetén
  • Lineáris diszkriminációs analízis p>1 esetén

Kvadratikus diszkriminációs analízis (QDA)

k-Legközelebbi szomszédok (k-NN)

  • Nem lineáris döntési határok készítése

Támogató vektor gépek (SVM)

  • A legyótitkosítási célfüggvény
  • A maximális margó classifier
  • Kernel függvények
  • Egy-vs-egy klasszifikáció
  • Egy-vs-minden klasszifikáció

Klasszifikációs módszerek összevetése

Mély tanulás

Bevezetés a mély tanulásba

Mesterséges neurális hálózatok (ANN)

  • Biológiai és mesterséges neurónok
  • Nem lineáris hipotézis
  • Modell reprezentáció
  • Példák és intuitív megközelítés
  • Átvitel függvény/aktiváló függvények
  • Típusos hálóarchitektúrák
    • Elosztott mesterséges neurális hálózat (feedforward ANN)
    • Többszintű elosztott hálózatok
  • Visszaterjesztési algoritmus (backpropagation)
  • Visszaterjesztés - tanítás és konvergencia
  • Függvények közelítése a visszaterjesztéssel
  • Praktikus és tervezési szempontok a visszaterjesztéses tanuláshoz

Mély tanulás

  • Mesterséges intelligencia (AI) és mély tanulás
  • Softmax regresszió
  • Saját tanulás (self-taught learning)
  • Mély hálózatok
  • Példák és alkalmazások

Gyakorlati munka:

Első lépések az R programban

  • Bevezetés az R programba
  • Alap parancsok és könyvtárak
  • Adatmanipuláció
  • Adatok importálása és exportálása
  • Grafikus és numerikus összefoglalók
  • Függvények írása

Regresszió

  • Egyszerű és többváltozós lineáris regresszió
  • Közvetítői tagok
  • Nem lineáris átalakítások
  • Dummy változós regresszió
  • Keresztevalutáció és bootstrap módszer
  • Alfajtó választási módszerek
  • Büntetés (ridge, lasso, elastic net)

Klasszifikáció

  • Logisztikus regresszió, LDA, QDA és k-NN
  • Újrarétegelt és szabályozott módszerek
  • Támogató vektor gépek (SVM)

Megjegyzések:

  • A gépi tanulási algoritmusok esetén esettanulmányokat használnak a alkalmazásuk, előnyeik és potenciális problémáik megvitatásához.
  • Különböző adathalmazok elemzése R programmal történő.

Követelmények

  • Az alapvető statisztikai fogalmak ismerete kívánt

Célcsoport

  • Adatszcientisták
  • Gépi tanulási mérnökök
  • AZMI érdeklődő szoftverfejlesztők
  • Adatmodellezésbe foglalkozó kutatók
  • Szakemberek, akik gépi tanulási technikákat szeretnének alkalmazni a üzleti vagy ipari tevékenységben
 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (6)

Közelgő kurzusok

Rokon kategóriák