Kurzusleírás

Bevezetés

Reinforcement Learning Alapok

Alapvető Reinforcement Learning technikák

Bevezetés a BURLAP-ba

Az érték konvergenciája és a politikai iteráció

Jutalomformálás

Felfedezés

Általánosítás

Részben megfigyelhető MDP-k

Lehetőségek

Logisztika

TD lambda

Szabályzati színátmenetek

Mély Q-tanulás

Témák a játékelméletben

Összegzés és a következő lépések

Követelmények

  • Pythonban való jártasság
  • A főiskolai kalkulus és a lineáris algebra megértése
  • A valószínűség és a Statistics alapvető ismerete
  • Tapasztalat gépi tanulási modellek létrehozásában Python és Numpy nyelven

Közönség

  • Fejlesztők
  • Adattudósok
 21 Hours

Résztvevők száma



Ár per résztvevő

Rokon tanfolyam

Rokon kategóriák