Lépjen kapcsolatba velünk

Kurzusleírás

EXO Infrastruktúra mint Kód

  • Az EXO üzembe helyezési mintáinak áttekintése: egycsomópontos, többszörös csomópontos és RDMA klaszterek
  • Függőségek telepítésének automatizálása (Xcode, uv, Node.js, Rust) konfigurációkezeléssel
  • Nix flakes használata reprodukálható EXO buildeléshez és fejlesztői környezetekhez
  • Ansible playbookok vagy shell szkriptek írása felügyelet nélküli klaszter kiépítéshez

Reprodukálható Buildelés és CI Integráció

  • Függőségek rögzítése és az irányítópult buildelése CI folyamatokban
  • EXO tesztelés futtatása GitHub Actions vagy GitLab CI futtatókörnyezetekben
  • Arany képek létrehozása és pillanatkép-alapú visszaállítási munkafolyamatok macOS és Linux virtuális gépekhez
  • Egyéni modell kártyák verziózáása az alkalmazás kód mellett

Klaszter Felderítés és Hálózati Automatizálás

  • mDNS és statikus DNS konfigurálása megbízható libp2p csomópont felderítéshez
  • Hálózati profilok létrehozásának és Thunderbolt híd kezelésének automatizálása macOS-en
  • Egyéni névterek (EXO_LIBP2P_NAMESPACE) használata dev, staging és prod klaszterek elkülönítéséhez
  • Tűzfal szabályok és hálózati szegmentálás több-bérlős környezetekhez

Tárolás és Modell Életciklus Kezelés

  • EXO_MODELS_DIRS és EXO_MODELS_READ_ONLY_DIRS stratégiák tervezése
  • NFS vagy SAN megosztások csatlakoztatása csak olvasható modell tárolóként gyors kiépítéshez
  • Elavult gyorsítótárak szemétgyűjtése és verziózárt súlyok megtartási szabályzatai
  • Modell előzetes letöltésének és állapotellenőrzésének automatizálása frissítések előtt

Monitorozás és Riasztás

  • EXO naplók szállítása központosított naplózó rendszerekbe (ELK, Loki vagy Splunk)
  • Grafana irányítópultok készítése EXO_TRACING_ENABLED kimenetből
  • Riasztás klaszter tagsági változásokra, OOM eseményekre és következtetési késleltetés növekedésekre
  • macmon hardver telemetria korrelálása modell teljesítmény romlásokkal

Frissítés, Visszaállítás és Katasztrófa Helyreállítás

  • EXO bináris frissítések előzetes tesztelése egy canary csomóponton a teljes flotta bevezetése előtt
  • Modell szintű visszaállítás: kvantált verziók közötti váltás újra letöltés nélkül
  • Klaszter állapotának, egyéni névtereknek és gyorsítótárazott súlyoknak biztonsági mentése és visszaállítása
  • Helyreállítási útmutatók dokumentálása teljes klaszter újraépítési forgatókönyvekhez

Biztonsági Keményítés és Megfelelőség

  • TLS alkalmazása a reverse proxy rétegben (nginx, traefik) az irányítópult és API számára
  • API korlátozás és IP engedélyezési lista implementálása EXO végpontokhoz
  • Klaszterek elkülönítése VLAN-okkal és zero-trust hálózati szabályzatokkal
  • Hozzáférés naplózása és üzembe helyezett modellek és verziók nyilvántartása

Követelmények

  • Tapasztalat DevOps gyakorlatokban (CI/CD, IaC, konténer orchestration)
  • Ismeret macOS vagy Linux rendszeradminisztrációban és csomagkezelésben
  • Hálózati, DNS és tárolási fogalmak ismerete

Közönség

  • DevOps mérnökök
  • Infrastruktúra architektusok
  • SRE-k, akik helyszíni AI munkaterhelésekért felelősek
 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (2)

Közelgő kurzusok

Rokon kategóriák