Kurzusleírás

Bevezetés a multimodális tanulásba

  • Az multimodális AI áttekintése
  • Kihívások a multimodális adatfeldolgozásban
  • A multimodális LLM-ek előnyei

A Nagy Nyelvi Modellek megértése

  • A legmodernebb LLM-ek architektúrája
  • LLM-ek tanítása multimodális adatokkal
  • Esettanulmányok: Sikeres multimodális LLM alkalmazások

Multimodális adatok feldolgozása

  • Adatfeldolgozási technikák szöveg, kép és hang esetében
  • Jellemző kinyerés és reprezentációs tanulás
  • Multimodális adatok integrálása LLM-ekbe

Multimodális LLM alkalmazások fejlesztése

  • Felhasználói felületek tervezése multimodális interakcióhoz
  • LLM-ek virtuális asszisztensekben és chatbotokban
  • Immerzív élmények létrehozása LLM-ekkel

Multimodális rendszerek értékelése és optimalizálása

  • Teljesítménymutatók multimodális LLM-ekhez
  • Optimalizálási stratégiák a jobb pontosság és hatékonyság érdekében
  • Elfogultság és igazságosság kezelése multimodális rendszerekben

Gyakorlati labor: Multimodális LLM projekt készítése

  • Multimodális adatkészlet beállítása
  • Multimodális LLM implementálása egy konkrét használati esethez
  • A rendszer tesztelése és finomítása

Összefoglalás és következő lépések

Követelmények

  • A gépi tanulás és a neurális hálózatok ismerete
  • Tapasztalat Python programozásban
  • Ismeret a különböző adattípusok (szöveg, kép, hang) előfeldolgozásában

Célközönség

  • Adattudósok
  • Gépi tanulási mérnökök
  • Szoftverfejlesztők
  • AI és természetes nyelvfeldolgozás területén dolgozó kutatók
 14 Órák

Résztvevők száma


Ár per résztvevő

Közelgő kurzusok

Rokon kategóriák