Kurzusleírás

Bevezetés a multimodális LLM-ekbe a Vertex AI-ben

  • Áttekintés a Vertex AI multimodális képességeiről
  • Gemini modellek és támogatott modalitások
  • Használati esetek vállalati és kutatási területeken

Fejlesztői környezet beállítása

  • A Vertex AI konfigurálása multimodális munkafolyamatokhoz
  • Adatkészletek kezelése különböző modalitásokon
  • Gyakorlati labor: környezet beállítása és adatkészlet előkészítése

Hosszú kontextusablakok és fejlett érvelés

  • A hosszú kontextusú munkafolyamatok megértése
  • Használati esetek tervezésben és döntéshozatalban
  • Gyakorlati labor: hosszú kontextusú elemzés implementálása

Keresztmodális munkafolyamat-tervezés

  • Szöveg, hang és kép elemzés kombinálása
  • Multimodális lépések láncolása folyamatokban
  • Gyakorlati labor: multimodális folyamat tervezése

A Gemini API paramétereinek kezelése

  • Multimodális bemenetek és kimenetek konfigurálása
  • Inferencia és hatékonyság optimalizálása
  • Gyakorlati labor: Gemini API paraméterek finomhangolása

Fejlett alkalmazások és integrációk

  • Interaktív multimodális ügynökök és asszisztensek
  • Külső API-k és eszközök integrálása
  • Gyakorlati labor: multimodális alkalmazás építése

Értékelés és iteráció

  • Multimodális teljesítmény tesztelése
  • Pontosság, összhang és eltérés metrikái
  • Gyakorlati labor: multimodális munkafolyamatok értékelése

Összefoglalás és következő lépések

Követelmények

  • Python programozási ismeretek
  • Tapasztalat gépi tanulási modellek fejlesztésében
  • Ismeret a multimodális adatokkal (szöveg, hang, kép)

Célközönség

  • AI kutatók
  • Haladó fejlesztők
  • ML tudósok
 14 Órák

Résztvevők száma


Ár per résztvevő

Közelgő kurzusok

Rokon kategóriák