Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
Bevezetés az AIOps-ba nyílt forráskódú eszközökkel
- Az AIOps fogalmak és előnyeinek áttekintése
- A Prometheus és Grafana a megfigyelhetőségi stackben
- A gépi tanulás szerepe az AIOps-ban: prediktív vs. reaktív elemzés
A Prometheus és Grafana beállítása
- A Prometheus telepítése és konfigurálása idősoros adatok gyűjtéséhez
- Irányítópultok létrehozása a Grafanában valós idejű metrikák használatával
- Exportálók, címkézés és szolgáltatásfelderítés felfedezése
Adatfeldolgozás a gépi tanuláshoz
- Prometheus metrikák kinyerése és átalakítása
- Adathalmazok előkészítése anomália detekcióra és előrejelzésre
- A Grafana átalakításainak vagy Python folyamatok használata
Gépi tanulás alkalmazása anomália detekcióra
- Alapvető ML modellek kiugró értékek detektálására (pl. Isolation Forest, One-Class SVM)
- Modellek betanítása és kiértékelése idősoros adatokon
- Anomáliák vizualizációja Grafana irányítópultokon
Metrikák előrejelzése gépi tanulással
- Egyszerű előrejelzési modellek létrehozása (ARIMA, Prophet, LSTM bevezetés)
- Rendszerterhelés vagy erőforrás-használat előrejelzése
- Előrejelzések használata korai riasztásra és skálázási döntésekhez
Gépi tanulás integrálása riasztásokkal és automatizálással
- Riasztási szabályok definiálása ML kimenetek vagy küszöbértékek alapján
- Az Alertmanager és értesítés-útválasztás használata
- Szkriptek vagy automatizációs munkafolyamatok indítása anomália detekciókor
AIOps skálázása és üzemeltetése
- Külső megfigyelhetőségi eszközök integrálása (pl. ELK stack, Moogsoft, Dynatrace)
- ML modellek üzemeltetése megfigyelhetőségi folyamatokban
- Ajánlott eljárások AIOps skálázáshoz
Összefoglalás és következő lépések
Követelmények
- Rendszermegfigyelés és megfigyelhetőség fogalmak ismerete
- Tapasztalat a Grafana vagy Prometheus használatában
- Ismeret a Pythonban és az alapvető gépi tanulási elvekről
Közönség
- Megfigyelhetőségi mérnökök
- Infrastruktúra és DevOps csapatok
- Megfigyelő platform architektok és site reliability engineers (SRE-k)
14 Órák