Kurzusleírás

Bevezetés az Reinforcement Learning-be

  • Mi az erősítéssel történő tanulás?
  • Kulcsfogalmak: ügynök, környezet, állapotok, cselekvések és jutalmak
  • Az erősítéssel történő tanulás kihívásai

Kutatás és kihasználás

  • A kutatás és kihasználás egyensúlyozása az RL-modellekben
  • Kutatási stratégiák: epsilon-kedvezmény, softmax és több

Q-tanulás és mély Q-hálózatok (DQN-ok)

  • Bevezetés a Q-tanulásba
  • DQN-ok megvalósítása TensorFlow segítségével
  • Q-tanulás optimalizálása tapasztalat-visszajátszás és célhálózatok segítségével

Politika alapú módszerek

  • Politikai gradiens algoritmusok
  • A REINFORCE algoritmus és megvalósítása
  • Actor-critic módszerek

Munka OpenAI Gym-mal

  • Környezetek beállítása a OpenAI Gym-ban
  • Ügynökök szimulálása dinamikus környezetekben
  • Ügynök teljesítményének értékelése

Haladó Reinforcement Learning technikák

  • Több ügynök erősítéssel történő tanulása
  • Mély determinisztikus politikai gradiens (DDPG)
  • Proximális politikai optimalizálás (PPO)

Reinforcement Learning modellek telepítése

  • Az erősítéssel történő tanulás valós világbeli alkalmazásai
  • RL-modellek integrálása termelési környezetbe

Összegzés és következő lépések

Követelmények

  • Python programozási tapasztalat
  • Mélytanulás és gépi tanulás alapelveinek alapos ismerete
  • Ismerete az algoritmusoknak és a matematikai fogalmaknak, amelyeket a megtérítő tanulásban használnak

A célközönség

  • Adattudósok
  • Gépi tanulás gyakorlók
  • Műszaki intelligencia kutatók
 28 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák