GPU programozás OpenACC-val Képzés
Az OpenACC egy nyílt szabvány a heterogén programozásra, amely lehetővé teszi, hogy a kód különböző platformokon és eszközökön fusson, például többmagos CPU-kon, GPU-kon, FPGA-kon és másokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő és középhaladó szintű fejlesztőknek szól, akik az OpenACC-t szeretnék használni heterogén eszközök programozására és párhuzamosságuk kihasználására.
A képzés végére a résztvevők képesek lesznek:
- OpenACC fejlesztői környezet beállítására.
- Alapvető OpenACC program írására és futtatására.
- Kód annotálására OpenACC direktívákkal és záradékokkal.
- OpenACC API és könyvtárak használatára.
- OpenACC programok profilozására, hibakeresésére és optimalizálására.
A kurzus formátuma
- Interaktív előadás és vita.
- Sok gyakorlat és gyakorlás.
- Gyakorlati implementáció élő laboratóriumi környezetben.
Kurzus testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Kurzusleírás
Bevezetés
- Mi az OpenACC?
- OpenACC vs OpenCL vs CUDA vs SYCL
- Az OpenACC funkcióinak és architektúrájának áttekintése
- A fejlesztői környezet beállítása
Bevezetés
- OpenACC projekt létrehozása a Visual Studio Code-ban
- A projekt szerkezetének és fájljainak felfedezése
- A program fordítása és futtatása
- Kimenet megjelenítése printf és fprintf segítségével
OpenACC direktívák és záradékok
- Az OpenACC direktívák és záradékok megértése
- Párhuzamos régiók létrehozása párhuzamos direktívákkal
- Fordító által kezelt párhuzamosság kernels direktívákkal
- Hurkok párhuzamosítása loop direktívákkal
- Adatmozgatás kezelése data direktívákkal
- Adatszinkronizálás update direktívákkal
- Adathasználat javítása cache direktívákkal
- Eszközfüggvények létrehozása routine direktívákkal
- Események szinkronizálása wait direktívákkal
OpenACC API
- Az OpenACC API szerepének megértése
- Eszköz információk és képességek lekérdezése
- Eszköz számának és típusának beállítása
- Hibák és kivételek kezelése
- Események létrehozása és szinkronizálása
OpenACC könyvtárak és interoperabilitás
- Az OpenACC könyvtárak és interoperabilitás megértése
- Matematikai, véletlen és komplex számok könyvtárainak használata
- Integráció más modellekkel (CUDA, OpenMP, MPI)
- Integráció GPU könyvtárakkal (cuBLAS, cuFFT)
OpenACC eszközök
- Az OpenACC eszközök megértése a fejlesztésben
- OpenACC programok profilozása és hibakeresése
- Teljesítményelemzés PGI Compiler, NVIDIA Nsight Systems, Allinea Forge segítségével
Optimalizálás
- Az OpenACC programok teljesítményét befolyásoló tényezők
- Adat lokalitás optimalizálása és átvitel csökkentése
- Hurkok párhuzamosításának és összevonásának optimalizálása
- Kernel párhuzamosításának és összevonásának optimalizálása
- Vektorizáció és automatikus hangolás optimalizálása
Összefoglalás és következő lépések
Követelmények
- A C/C++ vagy Fortran nyelv és a párhuzamos programozás alapjainak ismerete
- Alapvető ismeretek a számítógép architektúráról és memóriahierarchiáról
- Tapasztalat parancssori eszközökkel és kódszerkesztőkkel
Közönség
- Fejlesztők, akik szeretnék megtanulni, hogyan használják az OpenACC-t heterogén eszközök programozására és párhuzamosságuk kihasználására
- Fejlesztők, akik hordozható és skálázható kódot szeretnének írni, amely különböző platformokon és eszközökön futhat
- Programozók, akik szeretnék felfedezni a heterogén programozás magas szintű aspektusait és optimalizálni kódjuk hatékonyságát
A nyílt képzésekhez 5+ résztvevő szükséges.
GPU programozás OpenACC-val Képzés - Foglalás
GPU programozás OpenACC-val Képzés - Érdeklődés
GPU programozás OpenACC-val - Érdeklődjön a vezetői tanácsadásról!
Közelgő kurzusok
Rokon tanfolyam
Mesterséges Intelligencia Alkalmazások Fejlesztése a Huawei Ascend és CANN segítségével
21 ÓrákA Huawei Ascend egy nagy teljesítményű mesterséges intelligencia processzorokból álló család, amelyet következtetésre és tanításra terveztek.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középszintű mesterséges intelligencia mérnököknek és adattudósoknak szól, akik a Huawei Ascend platformját és a CANN eszközkészletét használva szeretnének neurális hálózati modelleket fejleszteni és optimalizálni.
A képzés végére a résztvevők képesek lesznek:
- Beállítani és konfigurálni a CANN fejlesztői környezetet.
- Mesterséges intelligencia alkalmazásokat fejleszteni a MindSpore és CloudMatrix munkafolyamatok segítségével.
- Teljesítményt optimalizálni az Ascend NPU-kon egyéni operátorok és tiling használatával.
- Modellek üzembe helyezése peremhálózati vagy felhő környezetekben.
A kurzus formátuma
- Interaktív előadás és megbeszélés.
- Gyakorlati alkalmazások a Huawei Ascend és CANN eszközkészletével.
- Irányított gyakorlatok a modellépítés, tanítás és üzembe helyezés fókuszálásával.
Kurzus Testreszabási Lehetőségek
- Ha testreszabott képzést szeretne kérni az Ön infrastruktúrája vagy adathalmaza alapján, kérjük, lépjen kapcsolatba velünk.
AI modellek üzembe helyezése CANN és Ascend AI processzorokkal
14 ÓrákA CANN (Compute Architecture for Neural Networks) a Huawei AI számítási vereme, amely az AI modellek üzembe helyezését és optimalizálását segíti az Ascend AI processzorokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középhaladó szintű AI fejlesztőknek és mérnököknek szól, akik hatékonyan szeretnék üzembe helyezni a betanított AI modelleket a Huawei Ascend hardveren, a CANN eszközkészlet és olyan eszközök, mint a MindSpore, TensorFlow vagy PyTorch segítségével.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a CANN architektúrát és annak szerepét az AI üzembe helyezési folyamatban.
- Modellek konvertálása és adaptálása népszerű keretrendszerekből Ascend-kompatibilis formátumokba.
- Eszközök használata, mint az ATC, OM modellkonverzió és MindSpore a peremhálózati és felhőalapú következtetésekhez.
- Üzembe helyezési problémák diagnosztizálása és teljesítmény optimalizálása az Ascend hardveren.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati labormunka a CANN eszközök és Ascend szimulátorok vagy eszközök használatával.
- Gyakorlati üzembe helyezési forgatókönyvek valós AI modellek alapján.
Kurzus testreszabási lehetőségek
- Egyedi képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
GPU Programozás Biren AI Gyorsítókön
21 ÓrákA Biren AI Gyorsítók nagy teljesítményű GPU-k, amelyeket AI és HPC számítási feladatokhoz terveztek, nagy léptékű tanítási és következtetési támogatással.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középhaladó és haladó szintű fejlesztőknek szól, akik szeretnének alkalmazásokat programozni és optimalizálni a Biren saját GPU stackjével, gyakorlati összehasonlításokkal a CUDA-alapú környezetekkel.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a Biren GPU architektúráját és memória-hierarchiáját.
- Beállítani a fejlesztői környezetet és használni a Biren programozási modelljét.
- CUDA-stílusú kódokat lefordítani és optimalizálni Biren platformokra.
- Teljesítményhangolási és hibakeresési technikákat alkalmazni.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati feladatok a Biren SDK használatával minta GPU feladatokon.
- Irányított gyakorlatok a portolásra és teljesítményhangolásra fókuszálva.
Képzés Testreszabási Lehetőségek
- Ha testreszabott képzést szeretne kérni az Ön alkalmazási stackje vagy integrációs igényei alapján, kérjük, lépjen kapcsolatba velünk a megbeszéléshez.
Cambricon MLU fejlesztés BANGPy és Neuware segítségével
21 ÓrákA Cambricon MLU-k (Machine Learning Units) speciális AI chipek, amelyek az inferencia és a tanítás során optimalizáltak edge és adatközponti forgatókönyvekhez.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középszintű fejlesztőknek szól, akik AI modelleket szeretnének építeni és üzembe helyezni a BANGPy keretrendszer és a Neuware SDK segítségével Cambricon MLU hardveren.
A képzés végén a résztvevők képesek lesznek:
- A BANGPy és Neuware fejlesztői környezet beállítására és konfigurálására.
- Python- és C++ alapú modellek fejlesztésére és optimalizálására Cambricon MLU-khoz.
- Modellek üzembe helyezésére edge és adatközponti eszközökön, amelyeken a Neuware fut.
- ML munkafolyamatok integrálására MLU-specifikus gyorsítási funkciókkal.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati alkalmazás a BANGPy és Neuware fejlesztéséhez és üzembe helyezéséhez.
- Irányított gyakorlatok az optimalizálás, integráció és tesztelés területén.
Képzés testreszabási lehetőségei
- Ha egy testreszabott képzést szeretne kérni ezen a kurzuson a Cambricon eszközmodell vagy használati eset alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Bevezetés a CANN-be AI keretrendszer fejlesztők számára
7 ÓrákA CANN (Compute Architecture for Neural Networks) a Huawei AI számítási eszközkészlete, amely az AI modellek fordítására, optimalizálására és üzembe helyezésére szolgál az Ascend AI processzorokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő szintű AI fejlesztőknek szól, akik szeretnék megérteni, hogyan illeszkedik a CANN a modell életciklusába a képzéstől az üzembe helyezésig, és hogyan működik együtt olyan keretrendszerekkel, mint a MindSpore, a TensorFlow és a PyTorch.
A képzés végén a résztvevők képesek lesznek:
- Megérteni a CANN eszközkészlet célját és architektúráját.
- CANN és MindSpore fejlesztői környezet beállítása.
- Egyszerű AI modell konvertálása és üzembe helyezése Ascend hardveren.
- Alapvető ismeretek szerezése a jövőbeli CANN optimalizálási vagy integrációs projektekhez.
A kurzus formátuma
- Interaktív előadás és megbeszélés.
- Gyakorlati laborok egyszerű modell üzembe helyezéssel.
- Lépésről lépésre bemutatás a CANN eszközláncról és integrációs pontjairól.
Kurzus testreszabási lehetőségek
- Egyéni képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
CANN az Edge AI telepítéséhez
14 ÓrákA Huawei Ascend CANN eszközkészlete hatékony AI következtetést tesz lehetővé peremhálózati eszközökön, mint például az Ascend 310. A CANN alapvető eszközöket biztosít a modellek fordításához, optimalizálásához és telepítéséhez olyan környezetekben, ahol a számítási kapacitás és a memória korlátozott.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) középszintű AI fejlesztők és integrátorok számára készült, akik az Ascend peremhálózati eszközökön szeretnék modelleket telepíteni és optimalizálni a CANN eszközlánc segítségével.
A képzés végére a résztvevők képesek lesznek:
- AI modellek előkészítése és konvertálása az Ascend 310 számára a CANN eszközök segítségével.
- Könnyű súlyú következtetési folyamatok építése a MindSpore Lite és az AscendCL segítségével.
- Modellek teljesítményének optimalizálása korlátozott számítási és memóriás környezetekben.
- AI alkalmazások telepítése és monitorozása valós peremhálózati használati esetekben.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati labormunka peremhálózati modellekkel és forgatókönyvekkel.
- Élő telepítési példák virtuális vagy fizikai peremhálózati hardveren.
Képzés testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
A Huawei AI számítási stackének megértése: a CANN-től a MindSpore-ig
14 ÓrákA Huawei AI stackje – az alacsony szintű CANN SDK-től a magas szintű MindSpore keretrendszerig – egy szorosan integrált AI fejlesztési és üzembe helyezési környezetet kínál, amely az Ascend hardverre van optimalizálva.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) kezdő és középhaladó szintű szakembereknek szól, akik szeretnék megérteni, hogyan működnek együtt a CANN és a MindSpore komponensek az AI életciklus-kezelés és infrastruktúra döntések támogatásában.
A képzés végén a résztvevők képesek lesznek:
- Megérteni a Huawei AI számítási stack rétegzett architektúráját.
- Azonosítani, hogyan támogatja a CANN a modelloptimalizálást és a hardver szintű üzembe helyezést.
- A MindSpore keretrendszer és eszközlánc értékelése az iparági alternatívákkal összehasonlítva.
- A Huawei AI stack elhelyezése vállalati vagy felhő/helyszíni környezetekben.
A képzés formátuma
- Interaktív előadás és vita.
- Élő rendszerbemutatók és esetalapú bemutatók.
- Opcionális irányított laborok a modelláramlásról a MindSpore-től a CANN-ig.
Képzés testreszabási lehetőségek
- Egyedi képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
Neurális hálózatok teljesítményének optimalizálása a CANN SDK-val
14 ÓrákA CANN SDK (Compute Architecture for Neural Networks) a Huawei AI számítási alapja, amely lehetővé teszi a fejlesztők számára, hogy finomhangolják és optimalizálják a telepített neurális hálózatok teljesítményét az Ascend AI processzorokon.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű AI fejlesztők és rendszermérnökök számára készült, akik a CANN fejlett eszközkészletének, beleértve a Graph Engine, TIK és egyéni operátor fejlesztését, használatával szeretnék optimalizálni az inferencia teljesítményt.
A képzés végére a résztvevők képesek lesznek:
- Megérteni a CANN futási architektúráját és a teljesítmény életciklusát.
- Profilozó eszközök és Graph Engine használata a teljesítményelemzéshez és optimalizáláshoz.
- Egyéni operátorok létrehozása és optimalizálása a TIK és TVM segítségével.
- Memória szűk keresztmetszetek feloldása és a modell átviteli sebességének javítása.
A kurzus formátuma
- Interaktív előadás és vita.
- Gyakorlati laborok valós idejű profilozással és operátor hangolással.
- Optimalizálási gyakorlatok peremhelyzeti telepítési példákkal.
Kurzus testreszabási lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
CANN SDK a Számítógépes Látás és NLP Folyamatokhoz
14 ÓrákA CANN SDK (Compute Architecture for Neural Networks) hatékony telepítési és optimalizálási eszközöket kínál valós idejű AI alkalmazásokhoz a számítógépes látás és NLP területén, különösen a Huawei Ascend hardvereken.
Ez az oktató által vezetett, élő képzés (online vagy helyszínen) középszintű AI szakembereknek szól, akik a CANN SDK segítségével szeretnének látási és nyelvi modelleket építeni, telepíteni és optimalizálni üzemi használati esetekhez.
A képzés végén a résztvevők képesek lesznek:
- CV és NLP modellek telepítése és optimalizálása a CANN és AscendCL segítségével.
- CANN eszközök használata modellek átalakításához és integrálásához élő folyamatokba.
- Inferencia teljesítmény optimalizálása feladatokhoz, mint az észlelés, osztályozás és érzelmek elemzése.
- Valós idejű CV/NLP folyamatok építése peremhálózati vagy felhőalapú telepítési forgatókönyvekhez.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati labor modell telepítéssel és teljesítményprofilozással.
- Élő folyamat tervezés valós CV és NLP használati esetekkel.
Kurzus Testreszabási Lehetőségek
- Ha testreszabott képzést szeretne kérni ehhez a kurzushoz, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Egyedi AI Operátorok Készítése CANN TIK és TVM Segítségével
14 ÓrákA CANN TIK (Tensor Instruction Kernel) és az Apache TVM lehetővé teszi a Huawei Ascend hardverre szánt AI modell operátorok fejlett optimalizálását és testreszabását.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű rendszerfejlesztőknek szól, akik egyedi operátorokat szeretnének építeni, üzembe helyezni és finomhangolni AI modellekhez a CANN TIK programozási modellje és a TVM fordító integrációja segítségével.
A képzés végére a résztvevők képesek lesznek:
- Egyedi AI operátorokat írni és tesztelni a TIK DSL segítségével Ascend processzorokon.
- Egyedi operátorokat integrálni a CANN futási környezetbe és végrehajtási gráfba.
- A TVM használata operátorok ütemezésére, automatikus finomhangolására és teljesítménytesztelésére.
- Egyedi számítási minták utasításszintű teljesítményének hibakeresése és optimalizálása.
A képzés formátuma
- Interaktív előadás és bemutató.
- Gyakorlati operátorprogramozás TIK és TVM folyamatok segítségével.
- Tesztelés és finomhangolás Ascend hardveren vagy szimulátorokon.
Képzés Testreszabási Lehetőségek
- Egyedi képzés igényléséhez kérjük, lépjen kapcsolatba velünk.
CUDA alkalmazások migrálása kínai GPU architektúrákra
21 ÓrákA kínai GPU architektúrák, mint például a Huawei Ascend, a Biren és a Cambricon MLU, a helyi AI és HPC piacokra szabott CUDA alternatívákat kínálnak.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű GPU programozóknak és infrastruktúra szakembereknek szól, akik a meglévő CUDA alkalmazásaikat szeretnék migrálni és optimalizálni kínai hardver platformokra.
A képzés végére a résztvevők képesek lesznek:
- Értékelni a meglévő CUDA munkaterhelések kompatibilitását a kínai chip alternatívákkal.
- Migrálni CUDA kódokat a Huawei CANN, Biren SDK és Cambricon BANGPy környezetekre.
- Összehasonlítani a teljesítményt és azonosítani az optimalizálási pontokat a platformok között.
- Megbirkózni a gyakorlati kihívásokkal a keresztezett architektúrák támogatása és üzembe helyezése terén.
A képzés formátuma
- Interaktív előadás és vita.
- Gyakorlati kódfordítás és teljesítmény-összehasonlítási laborok.
- Irányított gyakorlatok, amelyek a több-GPU adaptációs stratégiákra összpontosítanak.
Képzés testreszabási lehetőségei
- Ha egyedi képzést szeretne kérni ezen a kurzuson a platformja vagy CUDA projektje alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.
Teljesítményoptimalizálás az Ascend, Biren és Cambricon platformokon
21 ÓrákAz Ascend, Biren és Cambricon Kína vezető AI hardverplatformjai, mindegyik egyedi gyorsítási és profilozó eszközöket kínál a termelési méretű AI munkaterhelésekhez.
Ez az oktató által vezetett, élő képzés (online vagy helyszíni) haladó szintű AI infrastruktúra- és teljesítménymérnököknek szól, akik optimalizálni szeretnék a modell következtetési és betanítási munkafolyamatokat több kínai AI chip platformon.
A képzés végén a résztvevők képesek lesznek:
- Modellmérések végrehajtása az Ascend, Biren és Cambricon platformokon.
- Rendszer szűk keresztmetszetek és memória/számítási hatékonyság hiányosságok azonosítása.
- Grafikon-szintű, mag-szintű és operátor-szintű optimalizációk alkalmazása.
- Telepítési folyamatok finomhangolása az átviteli sebesség és késleltetés javítása érdekében.
A képzés formátuma
- Interaktív előadás és vita.
- Profilozó és optimalizáló eszközök gyakorlati használata minden platformon.
- Gyakorlati hangolási forgatókönyvekre összpontosított vezetett gyakorlatok.
Képzés testreszabási lehetőségek
- Ha egyedi képzést szeretne kérni ezen a kurzuson a teljesítménykörnyezet vagy modelltípus alapján, kérjük, lépjen kapcsolatba velünk a megbeszélés érdekében.