Kurzusleírás

Bevezetés a Reinforcement Learning-be

  • Mi a reinforcement learning?
  • Fontos fogalmak: ügynök, környezet, állapotok, cselekmények és jutalmak
  • A reinforcement learning kihívásai

Felfedezés és Kizárólagos Használat

  • A felfedezés és a kizárólagos használat egyensúlyozása az RL modellben
  • Felfedezési stratégiák: epsilon-greed, softmax, stb.

Q-Learning és Mély Q-Hálózatok (DQNs)

  • Bevezetés a Q-learning-be
  • DQNs implementálása a TensorFlow segítségével
  • A Q-learning optimalizálása tapasztalati visszajátszás és célmérő hálózatok segítségével

Politikai Metódusok

  • Politika gradiens algoritmusok
  • A REINFORCE algoritmus és annak implementálása
  • Aktor-kritikus módszerek

Az OpenAI Gym-mel való munka

  • Környezetek beállítása az OpenAI Gym-ban
  • Ügynökök szimulálása dinamikus környezetben
  • Ügynök teljesítményének értékelése

Fejlett Reinforcement Learning Technikák

  • Többügynökös reinforcement learning
  • Mély determinisztikus politika gradiens (DDPG)
  • Közelítő politika optimalizálás (PPO)

Reinforcement Learning Modell Alkalmazása

  • A reinforcement learning valós világi alkalmazásai
  • RL modell integrálása a gyártási környezetekbe

Összefoglalás és További Lépések

Követelmények

  • Python programozással való tapasztalat
  • Mély tanulás és gépi tanulás alapfogamaival kapcsolatos alapvető ismeretek
  • A reinforcement learningben használt algoritmusok és matematikai fogalmak ismerete

Célcsoport

  • Adattudósok
  • Gépi tanulás gyakorlók
  • AI kutatók
 28 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák