Kurzusleírás

Bevezetés

  • Valós problémák megoldása próba és hiba interakciókkal

Az adaptív tanulási rendszerek megértése és Artificial Intelligence (AI).

Hogyan érzékelik az ügynökök az állapotot

Hogyan jutalmazzuk meg az ügynököt

Esettanulmány: Interakció a webhely látogatóival

A környezet előkészítése az ügynök számára

Merüljön el mélyen az Reinforcement Learning algoritmusokba

Értékalapú módszerek kontra házirend-alapú módszerek

Reinforcement Learning modell kiválasztása

A Q-Learning Model-Free Reinforcement Learning algoritmus használata

Az ügynök tervezése

Esettanulmány: Intelligens asszisztensek

Az ügynök összekapcsolása gyártási környezettel

Az ügynöki műveletek eredményeinek mérése

Hibaelhárítás

Összefoglalás, és következtetés

Követelmények

  • A megerősítéses tanulás általános megértése
  • Gépi tanulásban szerzett tapasztalat
  • Java programozási tapasztalat

Közönség

  • Adattudósok
 21 Hours

Résztvevők száma



Ár per résztvevő

Vélemények (4)

Rokon tanfolyam

Rokon kategóriák