Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kurzusleírás
Bevezetés
- Tanulás pozitív megerősítésen keresztül
Element / Reinforcement Learning
Fontos feltételek (műveletek, állapotok, jutalmak, irányelvek, érték, Q-érték stb.)
A táblázatos megoldási módszerek áttekintése
Szoftverügynök létrehozása
Érték-, politika- és modellalapú megközelítések megértése
Munka a Markov döntési folyamattal (MDP)
Hogyan határozzák meg az irányelvek az ügynök viselkedését
Monte Carlo módszerek alkalmazása
Időbeli különbségek tanulása
n-step Bootstrapping
Hozzávetőleges megoldási módszerek
Politikai előrejelzés közelítéssel
Politikai ellenőrzés közelítéssel
Politikán kívüli módszerek közelítéssel
A jogosultsági nyomok megértése
Irányelv gradiens módszerek használata
Összefoglalás, és következtetés
Követelmények
- Gépi tanulásban szerzett tapasztalat
- Programming tapasztalat
Közönség
- Adattudósok
21 Hours