Kurzusleírás

Bevezetés

  • Tanulás pozitív megerősítésen keresztül

Element / Reinforcement Learning

Fontos feltételek (műveletek, állapotok, jutalmak, irányelvek, érték, Q-érték stb.)

A táblázatos megoldási módszerek áttekintése

Szoftverügynök létrehozása

Érték-, politika- és modellalapú megközelítések megértése

Munka a Markov döntési folyamattal (MDP)

Hogyan határozzák meg az irányelvek az ügynök viselkedését

Monte Carlo módszerek alkalmazása

Időbeli különbségek tanulása

n-step Bootstrapping

Hozzávetőleges megoldási módszerek

Politikai előrejelzés közelítéssel

Politikai ellenőrzés közelítéssel

Politikán kívüli módszerek közelítéssel

A jogosultsági nyomok megértése

Irányelv gradiens módszerek használata

Összefoglalás, és következtetés

Követelmények

  • Gépi tanulásban szerzett tapasztalat
  • Programming tapasztalat

Közönség

  • Adattudósok
 21 Hours

Résztvevők száma



Ár per résztvevő

Rokon tanfolyam

AI and Robotics for Nuclear - Extended

120 Hours

AI and Robotics for Nuclear

80 Hours

Rokon kategóriák