Kurzusleírás

Haladó Reinforcement Learning technikák

Reinforcement Learning modellek telepítése

Kutatás és kihasználás

Bevezetés a Reinforcement Learning-be

Strategiai módszerek

Q-Learning és mély Q-hálózatok (DQNs)

Összegzés és következő lépések

Munkavégzés a OpenAI Gym-mal

  • Kutatás és kihasználás egyensúlyozása az RL-modellekben
  • Kutatási stratégiák: epsilon-greedy, softmax és több más
  • Bevezetés a Q-Learning-be
  • DQN-ok implementálása TensorFlow-mal
  • Q-Learning optimalizálása élményújrahasználással és célhálózatokkal
  • Többszintű erősítési tanulás
  • Mély determinisztikus stratégiagradiens (DDPG)
  • Proximal Policy Optimization (PPO)
  • Strategiagradiens-algoritmusok
  • REINFORCE-algoritmus és annak implementálása
  • Actor-critic módszerek
  • Az erősítési tanulás valós alkalmazásai
  • RL-modellek integrálása termelési környezetbe
  • Környezetek beállítása a OpenAI Gym-ben
  • Ügynökök szimulálása dinamikus környezetekben
  • Ügynökök teljesítményének értékelése
  • Mi az erősítési tanulás?
  • Kulcsfogalmak: ügynök, környezet, állapotok, cselekvések és jutalmak
  • Az erősítési tanulás kihívásai

Követelmények

Célcsoport

  • Adat tudósok
  • Gép tanulási gyakorlók
  • Mesterséges intelligencia kutatói
  • Tapasztalat Python programozással
  • Alapvető tudás mély tanulás és gép tanulás fogalmai terén
  • Tudás az algoritmusok és a matematikai fogalmakról, amelyek a megerősítő tanulásban használatosak
 28 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák