Kurzusleírás

Bevezetés a Reinforcement Learning-be

  • Mi az a megerősítő tanulás?
  • Kulcsfogalmak: ügynök, környezet, állapotok, cselekvések és jutalmak
  • Kihívások a megerősítő tanulásban

Feltárás és kiaknázás

  • A feltárás és a kiaknázás egyensúlya RL modellekben
  • Feltárási stratégiák: epszilon-mohó, softmax stb

Q-Learning és Deep Q-Networks (DQN)

  • Bevezetés a Q-learningbe
  • DQN-ek megvalósítása a TensorFlow használatával
  • A Q-learning optimalizálása tapasztalatok visszajátszásával és célhálózatokkal

Politikai alapú módszerek

  • Szabályzati gradiens algoritmusok
  • REINFORCE algoritmus és megvalósítása
  • Színészkritikai módszerek

Munka a OpenAI Gym

  • Környezetek beállítása a OpenAI edzőteremben
  • Szimuláló ágensek dinamikus környezetben
  • Az ügynök teljesítményének értékelése

Haladó Reinforcement Learning technikák

  • Több ágens megerősítő tanulás
  • Mély determinisztikus irányelvi gradiens (DDPG)
  • Proximális házirend optimalizálás (PPO)

Reinforcement Learning modellek telepítése

  • A megerősítő tanulás valós alkalmazásai
  • RL modellek integrálása éles környezetbe

Összegzés és a következő lépések

Követelmények

  • Python programozási tapasztalat
  • A mély tanulás és a gépi tanulás fogalmainak alapvető ismerete
  • Megerősítő tanulásban használt algoritmusok és matematikai fogalmak ismerete

Közönség

  • Adattudósok
  • Gépi tanulással foglalkozó szakemberek
  • AI kutatók
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (4)

Közelgő kurzusok

Rokon kategóriák