Kurzusleírás

Bevezetés

  • Az adattudomány folyamata
  • Az adattudós szerepe és feladatai

A fejlesztői környezet előkészítése

  • Könyvtárak, keretrendszerek, nyelvek és eszközök
  • Helyi fejlesztés
  • Együttműködésen alapuló webes fejlesztés

Adatgyűjtés

  • Különböző típusú adatok
    • Strukturált
      • Helyi adatbázisok
      • Adatbázis-összekötők
      • Gyakori formátumok: xlxs, XML, Json, csv, ...
    • Nem strukturált
      • Kattintások, érzékelők, okostelefonok
      • API-k
      • Az eszközök internetje (IoT)
      • Dokumentumok, képek, videók, hangok
  • Esettanulmány: Nagy mennyiségű strukturálatlan adat folyamatos gyűjtése

Adattárolás

  • Relációs adatbázisok
  • Nem relációs adatbázisok
  • Hadoop: Elosztott fájlrendszer (HDFS)
  • Spark: Rugalmas elosztott adathalmaz (RDD)
  • Felhőalapú tárolás

Adatfeldolgozás

  • Betöltés, kiválasztás, tisztítás és átalakítás
  • Az adatminőség biztosítása - helyesség, értelmezhetőség és biztonság
  • Kivételjelentések

Felkészítéshez, feldolgozáshoz és elemzéshez használt nyelvek

  • R nyelv
    • Bevezetés az R-be
    • Adatmanipuláció, számítás és grafikus megjelenítés
  • Python
    • Bevezetés a Pythonba
    • Adatmanipuláció, feldolgozás, tisztítás és elemzés

Adatelemzés

  • Feltáró elemzés
    • Alapvető statisztikák
    • Vázlatos vizualizációk
    • Az adatok megértése
  • Ok-okozati összefüggések
  • Jellemzők és átalakítások
  • Gépi tanulás
    • Felügyelt vs felügyeletlen
    • Mikor melyik modellt használjuk
  • Természetes nyelvfeldolgozás (NLP)

Adatvizualizáció

  • Ajánlott eljárások
  • A megfelelő diagram kiválasztása a megfelelő adathoz
  • Színpaletták
  • A következő szintre lépés
    • Irányítópultok
    • Interaktív vizualizációk
  • Történetmesélés adatokkal

Összefoglalás és következtetés

Követelmények

  • Általános ismeretek az adatbázisokkal kapcsolatban
  • Alapvető ismeretek a statisztikáról
 35 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák