Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Bevezetés
- Tanulás pozitív megerősítésen keresztül
A Megerősítő Tanulás elemei
Fontos fogalmak (Cselekvések, Állapotok, Jutalmak, Politika, Érték, Q-Érték stb.)
Táblázatos megoldási módszerek áttekintése
Szoftver ügynök létrehozása
Értékalapú, politikáalapú és modellalapú megközelítések megértése
A Markov-döntési folyamat (MDP) használata
Hogyan határozzák meg a politika az ügynök viselkedését
Monte Carlo módszerek használata
Időbeli különbségen alapuló tanulás
n-lépéses bootstrapping
Közelítő megoldási módszerek
Politikán belüli előrejelzés közelítéssel
Politikán belüli irányítás közelítéssel
Politikán kívüli módszerek közelítéssel
Jogosultsági nyomok megértése
Politika gradiens módszerek használata
Összefoglalás és befejezés
Követelmények
- Tapasztalat a gépi tanulás területén
- Programozási tapasztalat
Célközönség
- Adattudósok
21 Órák