Kurzusleírás

Bevezetés

  • Az adattudományi folyamat
  • Adattudományos munkatársak szerepe és felelősségei

A Fejlesztési Környezet Előkészítése

  • Könyvtárak, keretrendszerek, programozási nyelvek és eszközök
  • Helyi fejlesztés
  • Webalapú együttműködő fejlesztés

Adatszolgáltatás

  • Adattípusok különböző módosításai
    • Strukturális
      • Helyi adatbázisok
      • Adatbázis-összekötők
      • Gyakori formátumok: xlxs, XML, Json, csv, ...
    • Nem strukturális
      • Kattintások, érzékelők, okostelefonok
      • API-k
      • Egyesültek internet (IoT)
      • Dokumentumok, képek, videók, hangfájlok
  • Esettanulmány: Strukturális adatok folyamatos beszerzése

Adattárolás

  • Relációs adatbázisok
  • Nem relációs adatbázisok
  • Hadoop: Elosztott Fájlrendszer (HDFS)
  • Spark: Elhárító Elosztott Adathalmaz (RDD)
  • Felhőalapú tárolás

Adatelőkészítés

  • Bevitel, kiválasztás, tisztítás és átalakítás
  • Adatminőség biztosítása - helyesség, értelmezhetőség és biztonság
  • Kivételek jelentése

Adatelőkészítés, Feldolgozás és Analízisre Használt Nyelvek

  • R nyelv
    • Bevezetés a R-be
    • Adatmanipuláció, számítás és grafikus megjelenítés
  • Python
    • Bevezetés a Python-be
    • Adatmanipuláció, feldolgozás, tisztítás és elemzés

Adatanalízis

  • Exploratív elemzés
    • Alapvető statisztikai ismeretek
    • Vázlatos megjelenítések
    • Adatértelmezés
  • Oka és következménye
  • Jellemzők és átalakítások
  • Gépi tanulás
    • Felügyelt vs. nem felügyelt tanulás
    • Mikor milyen modellt használjon
  • Természetes nyelvi feldolgozás (NLP)

Adatmegjelenítés

  • Javaslatok
  • A megfelelő diagram kiválasztása a megfelelő adatokra
  • Színkombinációk
  • További fejlesztések
    • Ikonpanel
    • Interaktív megjelenítések
  • Adatok elbeszélése

Összefoglalás és Következtetés

Követelmények

  • Adatbázisok alapvető fogalmai általános ismerete
  • Statika alapvető ismerete
 35 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák