Kurzusleírás

Bevezetés

  • Az adat előkészítés fontosságának megértése az elemzésben és a gépi tanulásban
  • Az adat előkészítés folyamat és szerepe az adatkörnyezetben
  • Általános kihívások az eredeti adatokban és hatásaik az elemzésre

Adatszolgáltatás és beszerzés

  • Az adatforrások: adatbázisok, API-k, elektronikus táblázatok, szövegfájlok stb.
  • Téchnikák az adatszolgáltatás és minőség biztosítása során
  • Adatok beszerzése különböző forrásból

Adattisztítási technikák

  • Hányados, szélső érték és inkonzisztenciák azonosítása és kezelése
  • Megkülönböztetések és hibák kezelése az adatkészletben
  • Valós adatkészletek tisztítása

Adat átalakítás és szabványozás

  • Az adat normalizálási és szabványozási technikák
  • Kategóriais adatkezelés: kódolás, intervallumos osztályozás, jellemzők kinyerése
  • Adatok átalakítása használható formátumba

Adat integráció és aggregáció

  • Különböző forrásból származó adatkészletek összeolvasztása és kombinálása
  • Az adatellentmondások feloldása és az adattípusok egyeztetése
  • Adataggregáció és konzolidáció technikák

Adatminőség biztosítása

  • Módszerek a teljes folyamat során történő adatminőséget és integritást biztosításra
  • Minőség ellenőrzési eljárások és validációs eljárások implementálása
  • Mutatók és gyakorlati alkalmazások az adatminőséget biztosító technikákra

Dimenzió csökkentése és jellemző kiválasztás

  • A dimenziócsökkentés szükségességének megértése
  • Técnikák, mint a PCA, a jellemzők kiválasztása és csökkentési stratégiák
  • Dimenziócsökkentési technikák implementálása

Összefoglalás és következő lépések

Követelmények

  • Alapvető ismeretek az adatelemzés területéről

Célcsoport

  • Adat elemzők
  • Adatbázis adminisztrátorok
  • IT-szakemberek
 14 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (2)

Közelgő kurzusok

Rokon kategóriák