Kurzusleírás

Az CANN optimalizációs képességei áttekintése

  • Módja, ahogyan az CANN-ben kezeli az inferencia teljesítményt
  • Edge és embedded AI rendszerek optimalizációs céljai
  • AI Core felhasználásának és memóriaallokációjának megértése

A Graph Engine használata elemzéshez

  • A Graph Engine és a végrehajtási folyamat bemutatása
  • Operátor gráfok és futási méretek vizualizálása
  • Optimalizálás érdekében számítási gráfok módosítása

A teljesítménymérek és profilozó eszközök

  • CANN Profilozó Eszköz (profiler) használata munkaterhelés-elemzéshez
  • Mag-kivitele idő és szűk keresztmetszetek elemzése
  • Memória-használati profilozás és tile-elrendezési stratégiák

Egyedi operátorok fejlesztése TIK-kal

  • TIK és operátorprogramozási modell áttekintése
  • Egyedi operátor implementálása TIK DSL használatával
  • Operátor teljesítményének tesztelése és benchmarkelése

Fejlett operátoroptimalizálás TVM-vel

  • TVM integráció bemutatása az CANN-vel
  • Automatikus optimalizálási stratégiák számítási gráfokhoz
  • Mikor és hogyan váltsunk TVM és TIK között

Memóriaoptimalizálási technikák

  • Memórialelhelyezés és pufferhelyezés kezelése
  • Technikák a chipen lévő memóriahasználat csökkentésére
  • Aszinkron végrehajtás és újrahasználat legjobb gyakorlatai

Valós világbeli bevezetés és esettanulmányok

  • Esettanulmány: teljesítményoptimálás okos város kameracsövekre
  • Esettanulmány: autonóm jármű inferencia stack optimalizálása
  • Iteratív profilozás és folyamatos fejlesztés irányelvei

Összegzés és következő lépések

Követelmények

  • Mély tanulási modellarchitektúrák és tréningmunkamenetek mély értelemmel
  • CANN, TensorFlow vagy PyTorch használatával történő modell beüzemelés tapasztalata
  • Linux CLI, shell script készítés és Python programozás ismerete

Célközönség

  • AI teljesítménymérnökök
  • Inferencia optimalizálási szakértők
  • Szélsőeszközökön vagy valós idejű rendszereken dolgozó fejlesztők
 14 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák