Kurzusleírás

Bevezetés az AIOps-be

  • AIOps mi és miért fontos
  • Hagyományos monitorozás vs. AIOps-alapú observabilitás
  • AIOps architektúra és kulcsfontosságú komponensek

Működési adatgyűjtés és normálzás

  • Observabilitási adattípusok: méretek, naplók és nyomkövetések
  • Adatok bevitele különböző forrásokból (szerverek, konténerek, felhő)
  • Agensek és exportálók (Prometheus, Beats, Fluentd) használata

Adatkorreláció és anomáliafelismerés

  • Időszériakorreláció és statisztikai módszerek
  • ML-modellek használata anomáliafelismeréshez
  • Események felismerése elosztott rendszerekben

Értesítések és zajcsökkentés

  • Intelligens értesítési szabályok és küszöbértékek tervezése
  • Elnyomás, dupla eltávolítás és értesítési csoportosítás
  • Integráció Alertmanagerrel, Slack-val, PagerDuty-vel vagy Opsgenie-vel

Hibafelderítés és vizualizáció

  • Dashboardok használata méretek vizualizálására és trendek észlelésére
  • Események és idővonalak vizsgálata hibafelderítéshez
  • Problémák nyomkövetése rétegek között elosztott nyomkövető eszközökkel

Automatizálás és javítás

  • Automatizált script-ek vagy folyamatok indítása eseményekből
  • Integráció ITSM rendszerekkel (ServiceNow, Jira)
  • Alkalmazási példák: önjavítás, skálázás, forgalomátirányítás

Nyílt forráskódú és kereskedelmi AIOps platformok

  • Eszközök áttekintése: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kritériumok egy AIOps platform kiválasztásához
  • Demo és gyakorlat egy kiválasztott stackkel

Összegzés és Következő lépések

Követelmények

  • Az IT üzemeltetési és rendszerfelügyeleti fogalmak megértése
  • Monitoring eszközök vagy dashbordokkal való tapasztalat
  • Az alapvető napló és mértékegységi formátumok ismerete

Célközönség

  • Az infrastruktúra és alkalmazásokért felelős üzemeltetési csapatok
  • Site Reliability Engineers (SREs)
  • IT-felügyeleti és megfigyelési csapatok
 14 Órák

Résztvevők száma


Ár résztvevőnként

Közelgő kurzusok

Rokon kategóriák