Kurzusleírás

Bevezetés

  • Tanulás pozitív megerősítésen keresztül

A Megerősítő Tanulás elemei

Fontos fogalmak (Cselekvések, Állapotok, Jutalmak, Politika, Érték, Q-Érték stb.)

Táblázatos megoldási módszerek áttekintése

Szoftver ügynök létrehozása

Értékalapú, politikáalapú és modellalapú megközelítések megértése

A Markov-döntési folyamat (MDP) használata

Hogyan határozzák meg a politika az ügynök viselkedését

Monte Carlo módszerek használata

Időbeli különbségen alapuló tanulás

n-lépéses bootstrapping

Közelítő megoldási módszerek

Politikán belüli előrejelzés közelítéssel

Politikán belüli irányítás közelítéssel

Politikán kívüli módszerek közelítéssel

Jogosultsági nyomok megértése

Politika gradiens módszerek használata

Összefoglalás és befejezés

Követelmények

  • Tapasztalat a gépi tanulás területén
  • Programozási tapasztalat

Célközönség

  • Adattudósok
 21 Órák

Résztvevők száma


Ár per résztvevő

Közelgő kurzusok

Rokon kategóriák