Kurzusleírás

Kínai AI GPU Ekoszisztéma áttekintése

  • Huawei Ascend, Biren, Cambricon MLU összehasonlítása
  • CUDA vs CANN, Biren SDK és BANGPy modellek
  • Ipari trendek és szolgáltatói ekoszisztémák

Átváltoztatás előkészítése

  • CUDA kódbázisának értékelése
  • Célplatformok és SDK-verziók azonosítása
  • Eszközlánc-telepítés és környezeti beállítás

Kódátültetési technikák

  • CUDA memóriahozzáférés és kernel-logika portolása
  • Számítási rács/szálmodellek megképzése
  • Automatizált vs. kézi átültetési lehetőségek

Platformspecifikus implementációk

  • Huawei CANN operátorok és készülékes magok használata
  • Biren SDK konverziós csővezeték
  • Modellek újrafelépítése BANGPy (Cambricon) segítségével

Cross-platform tesztelés és optimalizálás

  • Végrehajtási profilozás minden célplatformon
  • Memória beállítás és párhuzamos végrehajtás összehasonlítása
  • Teljesítménykövetés és iteráció

Kevert GPU környezetek kezelése

  • Hibrid telepítések több architektúrával
  • Visszamenő stratégiák és eszközdetekció
  • Abstrakt rétegek a kód fenntarthatóságához

Eseménytanulmányok és legjobb gyakorlatok

  • Látás/NLP modellek portolása Ascend vagy Cambricon platformokra
  • Inferencia folyamatok újrafelépítése Biren csoportokon
  • Verzióhiányok és API-reszek kezelése

Összegzés és Következő lépések

Követelmények

  • GPU-alapú alkalmazásprogramozási tapasztalat
  • GPU memóriamodellek és számítási magok megértése
  • Ismeret az AI-modellek telepítéséről vagy gyorsítási folyamatáról

A közönség

  • GPU programozók
  • Rendszerarchitektusok
  • Áttöltési szakértők
 21 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák