Kurzusleírás

Bevezetés

  • Az adat-előkészítés fontosságának megértése az analitikában és a gépi tanulásban
  • Adat-előkészítési folyamat és szerepe az adatéletciklusban
  • A nyers adatokkal kapcsolatos gyakori kihívások és az elemzésre gyakorolt hatás feltárása

Adatgyűjtés és adatgyűjtés

  • Adatforrások: adatbázisok, API-k, táblázatok, szöveges fájlok stb
  • Az adatgyűjtés technikái és az adatgyűjtés során az adatminőség biztosítása
  • Adatgyűjtés különböző forrásokból

Data Cleaning Technikák

  • Hiányzó értékek, kiugró értékek és következetlenségek azonosítása és kezelése
  • Az adatkészlet ismétlődéseinek és hibáinak kezelése
  • Valós adatkészletek tisztítása

Adatátalakítás és szabványosítás

  • Adatnormalizálási és szabványosítási technikák
  • Kategorikus adatkezelés: kódolás, binning és szolgáltatásfejlesztés
  • Nyers adatok átalakítása használható formátumokká

Data Integration és Összesítés

  • Különböző forrásokból származó adatkészletek egyesítése és kombinálása
  • Adatütközések feloldása és adattípusok összehangolása
  • Adatösszesítési és -konszolidációs technikák

Data Quality Biztosítás

  • Az adatok minőségének és integritásának biztosítására szolgáló módszerek a folyamat során
  • Minőségellenőrzések és érvényesítési eljárások végrehajtása
  • Esettanulmányok és az adatminőség-biztosítás gyakorlati alkalmazásai

Dimenziócsökkentés és jellemzők kiválasztása

  • A méretcsökkentés szükségességének megértése
  • Olyan technikák, mint a PCA, a jellemzők kiválasztása és a redukciós stratégiák
  • Dimenziócsökkentési technikák megvalósítása

Összegzés és a következő lépések

Követelmények

    Az adatfogalmak alapvető megértése

Közönség

    Adatelemzők Database rendszergazdák IT szakemberek
 14 Hours

Résztvevők száma



Ár per résztvevő

Vélemények (2)

Rokon tanfolyam

Rokon kategóriák