Kurzusleírás
1. Mélymegbízó Tanulás Bevezetése
- Mibe válik a megbízó tanulás?
- Különbségek a felügyelt, felügyelt nélküli és megbízó tanulás között
- DRL alkalmazások 2025-ben (robotika, egészségügy, pénzügy, logisztika)
- Agens-környezet kölcsönhatások megértése
2. Megbízó Tanulás Alapjai
- Markov-döntési folyamatok (MDP)
- Állapot, cselekvés, jutalom, politika és értékfüggvények
- Kutatás vs. kihasználás kompromisszuma
- Monte Carlo módszerek és időbeli differenciálás (TD) tanulás
3. Alapvető RL Algoritmusok Megvalósítása
- Táblázatos módszerek: dinamikus programozás, politika értékelése és iteráció
- Q-tanulás és SARSA
- Epsilon-keresés és leépülő stratégiák
- RL környezetek megvalósítása OpenAI Gymnasium-mal
4. Átmenet a Mélymegbízó Tanulásra
- Táblázatos módszerek korlátai
- Hálózatok használata függvény közelítésre
- Mély Q-hálózat (DQN) architektúra és munkafolyamat
- Élményújratöltés és célhálózatok
5. Fejlett DRL Algoritmusok
- Kettős DQN, duelling DQN és prioritásos élményújratöltés
- Politika gradiens módszerek: REINFORCE algoritmus
- Személyes-kritikus architektúrák (A2C, A3C)
- Közelítő politikai optimalizálás (PPO)
- Lágy személyes-kritikus (SAC)
6. Folytatott Cselekvési Térrel Dolgozási
- A folytonos irányítás kihívásai
- DDPG (Mély Determinisztikus Politikagradiens) használata
- Kettős Késleltetett DDPG (TD3)
7. Práctikus Eszközök és Keretek
- Stable-Baselines3 és Ray RLlib használata
- Naplózás és monitorozás TensorBoard-dal
- Hiperparaméter optimalizálás DRL modelljeihez
8. Jutalomtervezés és Környezettervezés
- Jutalomformálás és büntetés egyensúlyozás
- Sim-to-real átvitel tanulási fogalmak
- Egyedi környezet létrehozása a Gymnasium-ban
9. Részleges Láthatóságú Környezetek és Generalizáció
- Teljes állapotinformáció hiánya (POMDPs) kezelése
- Memória alapú megközelítések LSTM-ekkel és RNN-ekkel
- Agens robustsága és generalizálódásának javítása
10. Játékelmélet és Több Agens Megbízó Tanulás
- Bevezetés több agens környezetekbe
- Közreműködés vs. verseny
- Alkalmazások ellenfelekkel edzés és stratégiaoptimalizálásban
11. Esettanulmányok és Valós Állapotú Alkalmazások
- Autonóm vezetés szimulációk
- Dinamikus árképzés és pénzügyi kereskedelmi stratégiák
- Robotika és ipari automatizálás
12. Hibaelhárítás és Optimalizálás
- Instabil edzés diagnózisa
- Jutalomszegénység és túlfit kezelése
- DRL modelljeinek skálázása GPU-kon és elosztott rendszereken
13. Összefoglalás és Következő Lépések
- DRL architektúra és kulcsalgoritmusok áttekintése
- Ipari trendek és kutató irányok (pl. RLHF, hibrid modellje)
- További források és olvasmányi anyagok
Követelmények
- Python programozás ismerete
- Calculus és Lineáris Algebra ismerete
- Alapvető ismeretek a Valószínűségszámítás és a Statisztika területéről
- Tapasztalat az Önmegtanuló modell készítésében Python és NumPy vagy TensorFlow/PyTorch használatával
Célközönség
- AI és intelligens rendszerekbe érdekelt fejlesztők
- Adat tudósok, akik a megerősítő tanulási keretrendszerek kutatásával foglalkoznak
- Önmegtanuló rendszerekkel dolgozó Önmegtanuló mérnökök
Vélemények (5)
Hunter mesés, nagyon megnyerő, rendkívül hozzáértő és szimpatikus. Nagyon jól sikerült.
Rick Johnson - Laramie County Community College
Kurzus - Artificial Intelligence (AI) Overview
Gépi fordítás
Very flexible.
Frank Ueltzhoffer
Kurzus - Artificial Neural Networks, Machine Learning and Deep Thinking
Gépi fordítás
I liked the new insights in deep machine learning.
Josip Arneric
Kurzus - Neural Network in R
Gépi fordítás
Ann created a great environment to ask questions and learn. We had a lot of fun and also learned a lot at the same time.
Gudrun Bickelq
Kurzus - Introduction to the use of neural networks
Gépi fordítás
It was very interactive and more relaxed and informal than expected. We covered lots of topics in the time and the trainer was always receptive to talking more in detail or more generally about the topics and how they were related. I feel the training has given me the tools to continue learning as opposed to it being a one off session where learning stops once you've finished which is very important given the scale and complexity of the topic.
Jonathan Blease
Kurzus - Artificial Neural Networks, Machine Learning, Deep Thinking
Gépi fordítás