Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
EXO Infrastruktúra mint Kód
- Az EXO üzembe helyezési mintáinak áttekintése: egycsomópontos, többszörös csomópontos és RDMA klaszterek
- Függőségek telepítésének automatizálása (Xcode, uv, Node.js, Rust) konfigurációkezeléssel
- Nix flakes használata reprodukálható EXO buildeléshez és fejlesztői környezetekhez
- Ansible playbookok vagy shell szkriptek írása felügyelet nélküli klaszter kiépítéshez
Reprodukálható Buildelés és CI Integráció
- Függőségek rögzítése és az irányítópult buildelése CI folyamatokban
- EXO tesztelés futtatása GitHub Actions vagy GitLab CI futtatókörnyezetekben
- Arany képek létrehozása és pillanatkép-alapú visszaállítási munkafolyamatok macOS és Linux virtuális gépekhez
- Egyéni modell kártyák verziózáása az alkalmazás kód mellett
Klaszter Felderítés és Hálózati Automatizálás
- mDNS és statikus DNS konfigurálása megbízható libp2p csomópont felderítéshez
- Hálózati profilok létrehozásának és Thunderbolt híd kezelésének automatizálása macOS-en
- Egyéni névterek (EXO_LIBP2P_NAMESPACE) használata dev, staging és prod klaszterek elkülönítéséhez
- Tűzfal szabályok és hálózati szegmentálás több-bérlős környezetekhez
Tárolás és Modell Életciklus Kezelés
- EXO_MODELS_DIRS és EXO_MODELS_READ_ONLY_DIRS stratégiák tervezése
- NFS vagy SAN megosztások csatlakoztatása csak olvasható modell tárolóként gyors kiépítéshez
- Elavult gyorsítótárak szemétgyűjtése és verziózárt súlyok megtartási szabályzatai
- Modell előzetes letöltésének és állapotellenőrzésének automatizálása frissítések előtt
Monitorozás és Riasztás
- EXO naplók szállítása központosított naplózó rendszerekbe (ELK, Loki vagy Splunk)
- Grafana irányítópultok készítése EXO_TRACING_ENABLED kimenetből
- Riasztás klaszter tagsági változásokra, OOM eseményekre és következtetési késleltetés növekedésekre
- macmon hardver telemetria korrelálása modell teljesítmény romlásokkal
Frissítés, Visszaállítás és Katasztrófa Helyreállítás
- EXO bináris frissítések előzetes tesztelése egy canary csomóponton a teljes flotta bevezetése előtt
- Modell szintű visszaállítás: kvantált verziók közötti váltás újra letöltés nélkül
- Klaszter állapotának, egyéni névtereknek és gyorsítótárazott súlyoknak biztonsági mentése és visszaállítása
- Helyreállítási útmutatók dokumentálása teljes klaszter újraépítési forgatókönyvekhez
Biztonsági Keményítés és Megfelelőség
- TLS alkalmazása a reverse proxy rétegben (nginx, traefik) az irányítópult és API számára
- API korlátozás és IP engedélyezési lista implementálása EXO végpontokhoz
- Klaszterek elkülönítése VLAN-okkal és zero-trust hálózati szabályzatokkal
- Hozzáférés naplózása és üzembe helyezett modellek és verziók nyilvántartása
Követelmények
- Tapasztalat DevOps gyakorlatokban (CI/CD, IaC, konténer orchestration)
- Ismeret macOS vagy Linux rendszeradminisztrációban és csomagkezelésben
- Hálózati, DNS és tárolási fogalmak ismerete
Közönség
- DevOps mérnökök
- Infrastruktúra architektusok
- SRE-k, akik helyszíni AI munkaterhelésekért felelősek
21 Órák
Vélemények (2)
Craig nagyon aktívan vett részt a képzésben, mindig ellenőrizve, hogy figyelmesek-e vagyunk, alkalmazta a példákat naprakész tevékenységeinkhez és minden alkalommal adott választ, még akkor is, ha az információ nem szerepelhetett a bemutatóban.
Ecaterina Ioana Nicoale - BOOKING HOLDINGS ROMANIA SRL
Kurzus - DevOps Foundation®
Gépi fordítás
Magas elkötelezettség és tudás a képző szakembertől
Jacek - Softsystem
Kurzus - DevOps Engineering Foundation (DOEF)®
Gépi fordítás