Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF) Képzés

Az erősítő tanulás emberi visszajelződésből (RLHF) egy csúcstechnológia, amelyet a ChatGPT és más vezető mesterséges intelligencia rendszerek finomhangolására használnak.

Ez az oktatás, melyet tanárok vezetnek, élőben (online vagy helyszínen) a haladó szintű gépi tanulási mérnökök és mesterséges intelligencia kutatók számára készült, akik szeretnék RLHF-t alkalmazni nagy AI modellek finomhangolásához az eredmények, biztonság és igazságosság javítása érdekében.

Ez az oktatás végén a résztvevők képesek lesznek:

Az RLHF elméleti alapjait megérteni, valamint miért fontos az a modern AI-fejlesztésben.
Belsődiagramokat kialakítani emberi visszajelződés alapján az erősítő tanulási folyamatok irányításához.
Nagy nyelvi modelleket RLHF technikák segítségével finomhangolni, hogy a kimenetek emberi preferenciákkal igazodjanak meg.
Beszerezni a legjobb gyakorlatokat az RLHF folyamatainak teljes méretű AI rendszerekre való méretezéséhez.

A kurzus formája

Interaktív előadás és vita.
Sok gyakorlati feladat és gyakorlás.
Egy élő labor környezetben történő gyakorlati megvalósítás.

Kurzus személyre szabása

A kurzus személyre szabott változatának kérése érdekében kérem lépjek kapcsolatba velünk a rendezés céljából.

Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.

Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.

Közelgő kurzusok

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

2025-12-01 09:30

14 Órák

Budapest, City Center

540 EUR (Online.)

940 EUR (Tanterem)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

2025-12-15 09:30

14 Órák

Miskolc

540 EUR (Online.)

940 EUR (Tanterem)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

2025-12-29 09:30

14 Órák

Szeged

540 EUR (Online.)

940 EUR (Tanterem)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

2026-01-12 09:30

14 Órák

Kecskemét

540 EUR (Online.)

940 EUR (Tanterem)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

2026-01-26 09:30

14 Órák

Pécs, Belváros

540 EUR (Online.)

940 EUR (Tanterem)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF) Képzés

Kurzusleírás

Követelmények

Közelgő kurzusok

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Rokon kategóriák

Ez az oldal más országokban/régiókban található

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF) Képzés

Kurzusleírás

Követelmények

Közelgő kurzusok

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Az erősítő tanulás finomhangolása emberi visszajelződés alapján (RLHF)

Rokon tanfolyam

Haladó technikák a tranzfer tanításban

Finomhangolt Modellok Telepítése Gyártásba

Domain-Specific Fine-Tuning for Finance

A modellok és nagy nyelvek modelljeinek (LLM) finomhangolása

Hatékony Finomhangolás Alacsony Rangú Adaptációval (LoRA)

A multimodális modellek finomhangolása

NLP feladatokhoz való finomhangolás

DeepSeek LLM finomhangolása különleges AI-modellek létrehozására

Fine-Tuning Large Language Models Using QLoRA

Fine-Tuning Nyílt forráskódú LLMs (LLaMA, Mistral, Qwen, stb.)

Optimálisan nagy modellek finomhangolásához

Prompt Engineering and Few-Shot Fine-Tuning

Parameter-Efficient Fine-Tuning (PEFT) technikák a nagy nyelvi modellekhez

Transfer Learning Bevezetése

Fine-Tuning Kihajthatásainak Hozamodozása

Rokon kategóriák

Reinforcement Learning

Fine-Tuning

Ez az oldal más országokban/régiókban található

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites