Kurzusleírás

Bevezetés a Reinforcement Learningbe

  • Áttekintés a reinforcement learningről és alkalmazásairól
  • Különbségek a felügyelt, felügyelet nélküli és reinforcement learning között
  • Kulcsfogalmak: ügynök, környezet, jutalmak és politika

Markov Döntési Folyamatok (MDPs)

  • Állapotok, műveletek, jutalmak és állapotátmenetek megértése
  • Értékfüggvények és a Bellman-egyenlet
  • Dinamikus programozás MDPk megoldására

Alapvető RL algoritmusok

  • Táblázatos módszerek: Q-Learning és SARSA
  • Politika-alapú módszerek: REINFORCE algoritmus
  • Actor-Critic keretrendszerek és alkalmazásaik

Mély Reinforcement Learning

  • Bevezetés a Deep Q-Networks (DQN) világába
  • Tapasztalati visszajátszás és célhálózatok
  • Politika gradiens és fejlett mély RL módszerek

RL keretrendszerek és eszközök

  • Bevezetés az OpenAI Gym és más RL környezetekbe
  • PyTorch vagy TensorFlow használata RL modellfejlesztéshez
  • RL ügynökök képzése, tesztelése és benchmarkolása

Kihívások az RL-ben

  • Egyensúly a felfedezés és a kihasználás között a képzés során
  • A ritka jutalmak és a jóváírási problémák kezelése
  • Skálázhatóság és számítási kihívások az RL-ben

Gyakorlati tevékenységek

  • Q-Learning és SARSA algoritmusok implementálása nulláról
  • DQN alapú ügynök képzése egy egyszerű játékra az OpenAI Gymben
  • RL modellek finomhangolása a teljesítmény javítása érdekében egyedi környezetekben

Összefoglalás és következő lépések

Követelmények

  • Erős megértés a gépi tanulás alapelveiről és algoritmusairól
  • Python programozásban való jártasság
  • Ismeret a neurális hálózatokról és a mély tanulási keretrendszerekről

Közönség

  • Gépi tanulás mérnökök
  • AI szakemberek
 14 Órák

Résztvevők száma


Ár per résztvevő

Közelgő kurzusok

Rokon kategóriák