ROCm Windows rendszerhez Képzés
A ROCm egy nyílt forráskódú platform GPU programozásra, amely támogatja az AMD GPU-kat, valamint kompatibilitást biztosít a CUDA-val és az OpenCL-lel. A ROCm lehetővé teszi a programozó számára, hogy részletesen ismerje meg a hardver részleteket, és teljes körű irányítást biztosít a párhuzamosítási folyamat felett. Azonban ehhez szükség van a hardver architektúra, a memóriamodell, a végrehajtási modell és az optimalizálási technikák alapos ismeretére.
A ROCm for Windows egy új fejlesztés, amely lehetővé teszi a felhasználók számára, hogy a ROCm-et telepítsék és használják a Windows operációs rendszeren, amely széles körben használatos személyes és szakmai célokra. A ROCm for Windows lehetővé teszi a felhasználók számára, hogy kihasználják az AMD GPU-k teljesítményét különböző alkalmazásokban, mint például mesterséges intelligencia, játékok, grafikák és tudományos számítások.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő és középhaladó szintű fejlesztőknek szól, akik szeretnék telepíteni és használni a ROCm-et Windows rendszeren, hogy programozhassák az AMD GPU-kat és kihasználhassák azok párhuzamosítási képességeit.
A képzés végére a résztvevők képesek lesznek:
- Fejlesztői környezet beállítása, amely tartalmazza a ROCm Platformot, egy AMD GPU-t és a Visual Studio Code-ot Windows rendszeren.
- Alapvető ROCm program létrehozása, amely vektorösszeadást hajt végre a GPU-n, és lekéri az eredményeket a GPU memóriájából.
- ROCm API használata eszköz információk lekérdezésére, eszközmemória lefoglalására és felszabadítására, adatok másolására a gazda és az eszköz között, magok indítására és szálak szinkronizálására.
- HIP nyelv használata magok írására, amelyek a GPU-n futnak és az adatokat kezelik.
- HIP beépített függvények, változók és könyvtárak használata gyakori feladatok és műveletek végrehajtására.
- ROCm és HIP memóriaterületek használata, mint például globális, megosztott, konstans és helyi, az adatátvitel és a memória-hozzáférés optimalizálására.
- ROCm és HIP végrehajtási modellek használata a szálak, blokkok és rácsok irányítására, amelyek meghatározzák a párhuzamosítást.
- ROCm és HIP programok hibakeresése és tesztelése olyan eszközökkel, mint a ROCm Debugger és a ROCm Profiler.
- ROCm és HIP programok optimalizálása olyan technikákkal, mint az összeolvasztás, gyorsítótárazás, előtöltés és profilozás.
A képzés formátuma
- Interaktív előadás és vita.
- Sok gyakorlat és gyakorlás.
- Gyakorlati megvalósítás élő laboratóriumi környezetben.
Képzés testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni erre a kurzusra, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Kurzusleírás
Bevezetés
- Mi a ROCm?
- Mi a HIP?
- ROCm vs CUDA vs OpenCL
- A ROCm és HIP funkcióinak és architektúrájának áttekintése
- ROCm for Windows vs ROCm for Linux
Telepítés
- ROCm telepítése Windows rendszeren
- A telepítés ellenőrzése és az eszköz kompatibilitásának ellenőrzése
- ROCm frissítése vagy eltávolítása Windows rendszeren
- Gyakori telepítési problémák hibaelhárítása
Első lépések
- Új ROCm projekt létrehozása a Visual Studio Code használatával Windows rendszeren
- A projekt struktúrájának és fájljainak felfedezése
- A program fordítása és futtatása
- Az eredmények megjelenítése printf és fprintf használatával
ROCm API
- ROCm API használata a hoszt programban
- Eszköz információk és képességek lekérdezése
- Eszközmemória lefoglalása és felszabadítása
- Adatok másolása a gazda és az eszköz között
- Magok indítása és szálak szinkronizálása
- Hibák és kivételek kezelése
HIP nyelv
- HIP nyelv használata az eszköz programban
- Magok írása, amelyek a GPU-n futnak és az adatokat kezelik
- Adattípusok, minősítők, operátorok és kifejezések használata
- Beépített függvények, változók és könyvtárak használata
ROCm és HIP memóriamodell
- Különböző memóriaterületek használata, mint például globális, megosztott, konstans és helyi
- Különböző memóriaobjektumok használata, mint például mutatók, tömbök, textúrák és felületek
- Különböző memória-hozzáférési módok használata, mint például csak olvasható, csak írható, olvasható-írható stb.
- Memóriakonzisztencia modell és szinkronizációs mechanizmusok használata
ROCm és HIP végrehajtási modell
- Különböző végrehajtási modellek használata, mint például szálak, blokkok és rácsok
- Szálfüggvények használata, mint például hipThreadIdx_x, hipBlockIdx_x, hipBlockDim_x stb.
- Blokkfüggvények használata, mint például __syncthreads, __threadfence_block stb.
- Rácsfüggvények használata, mint például hipGridDim_x, hipGridSync, kooperatív csoportok stb.
Hibakeresés
- ROCm és HIP programok hibakeresése Windows rendszeren
- Visual Studio Code debugger használata változók, töréspontok, hívási verem stb. ellenőrzésére
- ROCm Debugger használata ROCm és HIP programok hibakeresésére AMD eszközökön
- ROCm Profiler használata ROCm és HIP programok elemzésére AMD eszközökön
Optimalizálás
- ROCm és HIP programok optimalizálása Windows rendszeren
- Összeolvasztási technikák használata a memóriaátvitel javítására
- Gyorsítótárazási és előtöltési technikák használata a memóriakésés csökkentésére
- Megosztott memória és helyi memória technikák használata a memória-hozzáférés és sávszélesség optimalizálására
- Profilozási és profilozási eszközök használata a végrehajtási idő és erőforrás-használat mérésére és javítására
Összefoglalás és következő lépések
Követelmények
- A C/C++ nyelv és a párhuzamos programozás alapjainak ismerete
- Alapvető ismeretek a számítógép architektúráról és a memóriahierarchiáról
- Tapasztalat parancssori eszközökkel és kódszerkesztőkkel
- Ismeret a Windows operációs rendszerről és a PowerShell-ről
Célközönség
- Fejlesztők, akik szeretnék megtanulni, hogyan telepítsék és használják a ROCm-et Windows rendszeren, hogy programozhassák az AMD GPU-kat és kihasználhassák azok párhuzamosítási képességeit
- Fejlesztők, akik szeretnének nagy teljesítményű és skálázható kódot írni, amely különböző AMD eszközökön futhat
- Programozók, akik szeretnék felfedezni a GPU programozás alacsony szintű aspektusait és optimalizálni kódjuk teljesítményét
A nyílt képzésekhez 5+ résztvevő szükséges.
ROCm Windows rendszerhez Képzés - Foglalás
ROCm Windows rendszerhez Képzés - Érdeklődés
ROCm Windows rendszerhez - Érdeklődjön a vezetői tanácsadásról!
Közelgő kurzusok
Rokon tanfolyam
Mesterséges Intelligencia Alkalmazások Fejlesztése a Huawei Ascend és CANN segítségével
21 ÓrákA Huawei Ascend egy nagy teljesítményű mesterséges intelligencia processzorokból álló család, amelyet következtetésre és tanításra terveztek.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középszintű mesterséges intelligencia mérnököknek és adattudósoknak szól, akik a Huawei Ascend platformját és a CANN eszközkészletét használva szeretnének neurális hálózati modelleket fejleszteni és optimalizálni.
A képzés végére a résztvevők képesek lesznek:
- Beállítani és konfigurálni a CANN fejlesztői környezetet.
- Mesterséges intelligencia alkalmazásokat fejleszteni a MindSpore és CloudMatrix munkafolyamatok segítségével.
- Teljesítményt optimalizálni az Ascend NPU-kon egyéni operátorok és tiling használatával.
- Modellek üzembe helyezése peremhálózati vagy felhő környezetekben.
A kurzus formátuma
- Interaktív előadás és megbeszélés.
- Gyakorlati alkalmazások a Huawei Ascend és CANN eszközkészletével.
- Irányított gyakorlatok a modellépítés, tanítás és üzembe helyezés fókuszálásával.
Kurzus Testreszabási Lehetőségek
- Ha testreszabott képzést szeretne kérni az Ön infrastruktúrája vagy adathalmaza alapján, kérjük, lépjen kapcsolatba velünk.
AI modellek üzembe helyezése CANN és Ascend AI processzorokkal
14 ÓrákA CANN (Compute Architecture for Neural Networks) a Huawei AI számítási vereme, amely az AI modellek üzembe helyezését és optimalizálását segíti az Ascend AI processzorokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középhaladó szintű AI fejlesztőknek és mérnököknek szól, akik hatékonyan szeretnék üzembe helyezni a betanított AI modelleket a Huawei Ascend hardveren, a CANN eszközkészlet és olyan eszközök, mint a MindSpore, TensorFlow vagy PyTorch segítségével.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a CANN architektúrát és annak szerepét az AI üzembe helyezési folyamatban.
- Modellek konvertálása és adaptálása népszerű keretrendszerekből Ascend-kompatibilis formátumokba.
- Eszközök használata, mint az ATC, OM modellkonverzió és MindSpore a peremhálózati és felhőalapú következtetésekhez.
- Üzembe helyezési problémák diagnosztizálása és teljesítmény optimalizálása az Ascend hardveren.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati labormunka a CANN eszközök és Ascend szimulátorok vagy eszközök használatával.
- Gyakorlati üzembe helyezési forgatókönyvek valós AI modellek alapján.
Kurzus testreszabási lehetőségek
- Egyedi képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
AI következtetés és üzembe helyezés CloudMatrix-szel
21 ÓrákA CloudMatrix a Huawei egységesített AI fejlesztési és üzembe helyezési platformja, amely skálázható, éles környezetben használható következtetési folyamatokat támogat.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő és középhaladó szintű AI szakembereknek szól, akik a CloudMatrix platformot szeretnék használni AI modellek üzembe helyezésére és monitorozására, CANN és MindSpore integrációval.
A képzés végére a résztvevők képesek lesznek:
- A CloudMatrix használata modellek csomagolására, üzembe helyezésére és kiszolgálására.
- Modellek konvertálása és optimalizálása Ascend chipkészletekre.
- Folyamatok beállítása valós idejű és kötegelt következtetési feladatokhoz.
- Üzembe helyezések monitorozása és teljesítmény finomhangolása éles környezetben.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati feladatok a CloudMatrix használatával valós üzembe helyezési forgatókönyvekben.
- Irányított gyakorlatok a konverzióra, optimalizálásra és skálázásra fókuszálva.
Képzés testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni az Ön AI infrastruktúrája vagy felhő környezete alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
GPU Programozás Biren AI Gyorsítókön
21 ÓrákA Biren AI Gyorsítók nagy teljesítményű GPU-k, amelyeket AI és HPC számítási feladatokhoz terveztek, nagy léptékű tanítási és következtetési támogatással.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középhaladó és haladó szintű fejlesztőknek szól, akik szeretnének alkalmazásokat programozni és optimalizálni a Biren saját GPU stackjével, gyakorlati összehasonlításokkal a CUDA-alapú környezetekkel.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a Biren GPU architektúráját és memória-hierarchiáját.
- Beállítani a fejlesztői környezetet és használni a Biren programozási modelljét.
- CUDA-stílusú kódokat lefordítani és optimalizálni Biren platformokra.
- Teljesítményhangolási és hibakeresési technikákat alkalmazni.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati feladatok a Biren SDK használatával minta GPU feladatokon.
- Irányított gyakorlatok a portolásra és teljesítményhangolásra fókuszálva.
Képzés Testreszabási Lehetőségek
- Ha testreszabott képzést szeretne kérni az Ön alkalmazási stackje vagy integrációs igényei alapján, kérjük, lépjen kapcsolatba velünk a megbeszéléshez.
Cambricon MLU fejlesztés BANGPy és Neuware segítségével
21 ÓrákA Cambricon MLU-k (Machine Learning Units) speciális AI chipek, amelyek az inferencia és a tanítás során optimalizáltak edge és adatközponti forgatókönyvekhez.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középszintű fejlesztőknek szól, akik AI modelleket szeretnének építeni és üzembe helyezni a BANGPy keretrendszer és a Neuware SDK segítségével Cambricon MLU hardveren.
A képzés végén a résztvevők képesek lesznek:
- A BANGPy és Neuware fejlesztői környezet beállítására és konfigurálására.
- Python- és C++ alapú modellek fejlesztésére és optimalizálására Cambricon MLU-khoz.
- Modellek üzembe helyezésére edge és adatközponti eszközökön, amelyeken a Neuware fut.
- ML munkafolyamatok integrálására MLU-specifikus gyorsítási funkciókkal.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati alkalmazás a BANGPy és Neuware fejlesztéséhez és üzembe helyezéséhez.
- Irányított gyakorlatok az optimalizálás, integráció és tesztelés területén.
Képzés testreszabási lehetőségei
- Ha egy testreszabott képzést szeretne kérni ezen a kurzuson a Cambricon eszközmodell vagy használati eset alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Bevezetés a CANN-be AI keretrendszer fejlesztők számára
7 ÓrákA CANN (Compute Architecture for Neural Networks) a Huawei AI számítási eszközkészlete, amely az AI modellek fordítására, optimalizálására és üzembe helyezésére szolgál az Ascend AI processzorokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő szintű AI fejlesztőknek szól, akik szeretnék megérteni, hogyan illeszkedik a CANN a modell életciklusába a képzéstől az üzembe helyezésig, és hogyan működik együtt olyan keretrendszerekkel, mint a MindSpore, a TensorFlow és a PyTorch.
A képzés végén a résztvevők képesek lesznek:
- Megérteni a CANN eszközkészlet célját és architektúráját.
- CANN és MindSpore fejlesztői környezet beállítása.
- Egyszerű AI modell konvertálása és üzembe helyezése Ascend hardveren.
- Alapvető ismeretek szerezése a jövőbeli CANN optimalizálási vagy integrációs projektekhez.
A kurzus formátuma
- Interaktív előadás és megbeszélés.
- Gyakorlati laborok egyszerű modell üzembe helyezéssel.
- Lépésről lépésre bemutatás a CANN eszközláncról és integrációs pontjairól.
Kurzus testreszabási lehetőségek
- Egyéni képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
CANN az Edge AI telepítéséhez
14 ÓrákA Huawei Ascend CANN eszközkészlete hatékony AI következtetést tesz lehetővé peremhálózati eszközökön, mint például az Ascend 310. A CANN alapvető eszközöket biztosít a modellek fordításához, optimalizálásához és telepítéséhez olyan környezetekben, ahol a számítási kapacitás és a memória korlátozott.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középszintű AI fejlesztők és integrátorok számára készült, akik az Ascend peremhálózati eszközökön szeretnék modelleket telepíteni és optimalizálni a CANN eszközlánc segítségével.
A képzés végére a résztvevők képesek lesznek:
- AI modellek előkészítése és konvertálása az Ascend 310 számára a CANN eszközök segítségével.
- Könnyű súlyú következtetési folyamatok építése a MindSpore Lite és az AscendCL segítségével.
- Modellek teljesítményének optimalizálása korlátozott számítási és memóriás környezetekben.
- AI alkalmazások telepítése és monitorozása valós peremhálózati használati esetekben.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati labormunka peremhálózati modellekkel és forgatókönyvekkel.
- Élő telepítési példák virtuális vagy fizikai peremhálózati hardveren.
Képzés testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
A Huawei AI számítási stackének megértése: a CANN-től a MindSpore-ig
14 ÓrákA Huawei AI stackje – az alacsony szintű CANN SDK-től a magas szintű MindSpore keretrendszerig – egy szorosan integrált AI fejlesztési és üzembe helyezési környezetet kínál, amely az Ascend hardverre van optimalizálva.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő és középhaladó szintű szakembereknek szól, akik szeretnék megérteni, hogyan működnek együtt a CANN és a MindSpore komponensek az AI életciklus-kezelés és infrastruktúra döntések támogatásában.
A képzés végén a résztvevők képesek lesznek:
- Megérteni a Huawei AI számítási stack rétegzett architektúráját.
- Azonosítani, hogyan támogatja a CANN a modelloptimalizálást és a hardver szintű üzembe helyezést.
- A MindSpore keretrendszer és eszközlánc értékelése az iparági alternatívákkal összehasonlítva.
- A Huawei AI stack elhelyezése vállalati vagy felhő/helyszíni környezetekben.
A képzés formátuma
- Interaktív előadás és vita.
- Élő rendszerbemutatók és esetalapú bemutatók.
- Opcionális irányított laborok a modelláramlásról a MindSpore-től a CANN-ig.
Képzés testreszabási lehetőségek
- Egyedi képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
Neurális hálózatok teljesítményének optimalizálása a CANN SDK-val
14 ÓrákA CANN SDK (Compute Architecture for Neural Networks) a Huawei AI számítási alapja, amely lehetővé teszi a fejlesztők számára, hogy finomhangolják és optimalizálják a telepített neurális hálózatok teljesítményét az Ascend AI processzorokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű AI fejlesztők és rendszermérnökök számára készült, akik a CANN fejlett eszközkészletének, beleértve a Graph Engine, TIK és egyéni operátor fejlesztését, használatával szeretnék optimalizálni az inferencia teljesítményt.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a CANN futási architektúráját és a teljesítmény életciklusát.
- Profilozó eszközök és Graph Engine használata a teljesítményelemzéshez és optimalizáláshoz.
- Egyéni operátorok létrehozása és optimalizálása a TIK és TVM segítségével.
- Memória szűk keresztmetszetek feloldása és a modell átviteli sebességének javítása.
A kurzus formátuma
- Interaktív előadás és vita.
- Gyakorlati laborok valós idejű profilozással és operátor hangolással.
- Optimalizálási gyakorlatok peremhelyzeti telepítési példákkal.
Kurzus testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
CANN SDK a Számítógépes Látás és NLP Folyamatokhoz
14 ÓrákA CANN SDK (Compute Architecture for Neural Networks) hatékony telepítési és optimalizálási eszközöket kínál valós idejű AI alkalmazásokhoz a számítógépes látás és NLP területén, különösen a Huawei Ascend hardvereken.
Ez az oktató által vezetett, élő képzés (online vagy helyszínen) középszintű AI szakembereknek szól, akik a CANN SDK segítségével szeretnének látási és nyelvi modelleket építeni, telepíteni és optimalizálni üzemi használati esetekhez.
A képzés végén a résztvevők képesek lesznek:
- CV és NLP modellek telepítése és optimalizálása a CANN és AscendCL segítségével.
- CANN eszközök használata modellek átalakításához és integrálásához élő folyamatokba.
- Inferencia teljesítmény optimalizálása feladatokhoz, mint az észlelés, osztályozás és érzelmek elemzése.
- Valós idejű CV/NLP folyamatok építése peremhálózati vagy felhőalapú telepítési forgatókönyvekhez.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati labor modell telepítéssel és teljesítményprofilozással.
- Élő folyamat tervezés valós CV és NLP használati esetekkel.
Kurzus Testreszabási Lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Egyedi AI Operátorok Készítése CANN TIK és TVM Segítségével
14 ÓrákA CANN TIK (Tensor Instruction Kernel) és az Apache TVM lehetővé teszi a Huawei Ascend hardverre szánt AI modell operátorok fejlett optimalizálását és testreszabását.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű rendszerfejlesztőknek szól, akik egyedi operátorokat szeretnének építeni, üzembe helyezni és finomhangolni AI modellekhez a CANN TIK programozási modellje és a TVM fordító integrációja segítségével.
A képzés végére a résztvevők képesek lesznek:
- Egyedi AI operátorokat írni és tesztelni a TIK DSL segítségével Ascend processzorokon.
- Egyedi operátorokat integrálni a CANN futási környezetbe és végrehajtási gráfba.
- A TVM használata operátorok ütemezésére, automatikus finomhangolására és teljesítménytesztelésére.
- Egyedi számítási minták utasításszintű teljesítményének hibakeresése és optimalizálása.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati operátorprogramozás TIK és TVM folyamatok segítségével.
- Tesztelés és finomhangolás Ascend hardveren vagy szimulátorokon.
Képzés Testreszabási Lehetőségek
- Egyedi képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
CUDA alkalmazások migrálása kínai GPU architektúrákra
21 ÓrákA kínai GPU architektúrák, mint például a Huawei Ascend, a Biren és a Cambricon MLU, a helyi AI és HPC piacokra szabott CUDA alternatívákat kínálnak.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű GPU programozóknak és infrastruktúra szakembereknek szól, akik a meglévő CUDA alkalmazásaikat szeretnék migrálni és optimalizálni kínai hardver platformokra.
A képzés végére a résztvevők képesek lesznek:
- Értékelni a meglévő CUDA munkaterhelések kompatibilitását a kínai chip alternatívákkal.
- Migrálni CUDA kódokat a Huawei CANN, Biren SDK és Cambricon BANGPy környezetekre.
- Összehasonlítani a teljesítményt és azonosítani az optimalizálási pontokat a platformok között.
- Megbirkózni a gyakorlati kihívásokkal a keresztezett architektúrák támogatása és üzembe helyezése terén.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati kódfordítás és teljesítmény-összehasonlítási laborok.
- Irányított gyakorlatok, amelyek a több-GPU adaptációs stratégiákra összpontosítanak.
Képzés testreszabási lehetőségei
- Ha egyedi képzést szeretne kérni ezen a kurzuson a platformja vagy CUDA projektje alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Teljesítményoptimalizálás az Ascend, Biren és Cambricon platformokon
21 ÓrákAz Ascend, Biren és Cambricon Kína vezető AI hardverplatformjai, mindegyik egyedi gyorsítási és profilozó eszközöket kínál a termelési méretű AI munkaterhelésekhez.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű AI infrastruktúra- és teljesítménymérnököknek szól, akik optimalizálni szeretnék a modell következtetési és betanítási munkafolyamatokat több kínai AI chip platformon.
A képzés végén a résztvevők képesek lesznek:
- Modellmérések végrehajtása az Ascend, Biren és Cambricon platformokon.
- Rendszer szűk keresztmetszetek és memória/számítási hatékonyság hiányosságok azonosítása.
- Grafikon-szintű, mag-szintű és operátor-szintű optimalizációk alkalmazása.
- Telepítési folyamatok finomhangolása az átviteli sebesség és késleltetés javítása érdekében.
A képzés formátuma
- Interaktív előadás és vita.
- Profilozó és optimalizáló eszközök gyakorlati használata minden platformon.
- Gyakorlati hangolási forgatókönyvekre összpontosított vezetett gyakorlatok.
Képzés testreszabási lehetőségek
- Ha egyedi képzést szeretne kérni ezen a kurzuson a teljesítménykörnyezet vagy modelltípus alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.