Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Nyílt AIOps architektúra tervezése
- A nyílt AIOps folyamatok kulcsfontosságú komponenseinek áttekintése
- Adatáramlás a betöltéstől a riasztásig
- Eszközök összehasonlítása és integrációs stratégia
Adatgyűjtés és aggregáció
- Idősorok betöltése a Prometheus segítségével
- Naplók rögzítése Logstash és Beats segítségével
- Adatok normalizálása több forrásból származó adatok korrelálásához
Megfigyelhetőségi irányítópultok készítése
- Metrikák vizualizálása Grafana segítségével
- Kibana irányítópultok készítése naplóelemzéshez
- Elasticsearch lekérdezések használata működési betekintések kinyeréséhez
Anomáliadetektálás és incidens előrejelzés
- Megfigyelhetőségi adatok exportálása Python folyamatokba
- ML modellek betanítása kiugró értékek észlelésére és előrejelzésre
- Modellek üzembe helyezése élő következtetéshez a megfigyelhetőségi folyamatban
Riasztás és automatizálás nyílt eszközökkel
- Prometheus riasztási szabályok és Alertmanager útválasztás létrehozása
- Szkriptek vagy API munkafolyamatok indítása automatikus válaszadáshoz
- Nyílt forráskódú orchestration eszközök használata (pl. Ansible, Rundeck)
Integráció és skálázhatóság szempontjai
- Nagy mennyiségű adat betöltésének és hosszú távú tárolásának kezelése
- Biztonság és hozzáférés-vezérlés nyílt forráskódú stackekben
- Rétegek független skálázása: betöltés, feldolgozás, riasztás
Valós alkalmazások és bővítések
- Esettanulmányok: teljesítményhangolás, leállások megelőzése és költségoptimalizálás
- Folyamatok bővítése nyomkövetési eszközökkel vagy szolgáltatási gráfokkal
- Ajánlott eljárások az AIOps éles környezetben történő üzemeltetéséhez és karbantartásához
Összefoglalás és következő lépések
Követelmények
- Tapasztalat megfigyelhetőségi eszközökkel, mint a Prometheus vagy az ELK
- Alapvető ismeretek Pythonban és gépi tanulásban
- IT műveletek és riasztási munkafolyamatok ismerete
Célközönség
- Haladó szintű site reliability engineers (SRE-k)
- Műveletekben dolgozó adatmérnökök
- DevOps platform vezetők és infrastruktúra architektusok
14 Órák