Kurzusleírás

Bevezetés az adatelemzésbe és a Big Databa

  • Mi teszi a Big Datát "Naggyá"?
    • Sebesség, mennyiség, változatosság, hitelesség (VVVV)
  • Korlátok a hagyományos adatfeldolgozásban
  • Elosztott feldolgozás
  • Statisztikai elemzés
  • Gépi tanulás típusai
  • Adatvizualizáció

Big Data szerepkörök és felelősségek

  • Rendszergazdák
  • Fejlesztők
  • Adatelemzők

Adatelemzéshez használt nyelvek

  • R nyelv
    • Miért R az adatelemzéshez?
    • Adatmanipuláció, számítás és grafikus megjelenítés
  • Python
    • Miért Python az adatelemzéshez?
    • Adat manipulálása, feldolgozása, tisztítása és feldolgozása

Adatelemzési megközelítések

  • Statisztikai elemzés
    • Idősor elemzés
    • Előrejelzés korrelációs és regressziós modellekkel
    • Inferenciális statisztika (becslés)
    • Leíró statisztika Big Data halmazokban (pl. átlag számítás)
  • Gépi tanulás
    • Felügyelt vs felügyeletlen tanulás
    • Osztályozás és klaszterezés
    • Specifikus módszerek költségének becslése
    • Szűrés
  • Természetes nyelv feldolgozás
    • Szöveg feldolgozása
    • A szöveg jelentésének megértése
    • Automatikus szöveg generálás
    • Érzelem elemzés / téma elemzés
  • Számítógépes látás
    • Képek beszerzése, feldolgozása, elemzése és megértése
    • 3D jelenetek rekonstruálása, értelmezése és megértése
    • Képadatok felhasználása döntéshozatalhoz

Big Data infrastruktúra

  • Adattárolás
    • Relációs adatbázisok (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Nem relációs adatbázisok (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • A részletek megértése
      • Hierarchikus adatbázisok
      • Objektum orientált adatbázisok
      • Dokumentum orientált adatbázisok
      • Grafikus orientált adatbázisok
      • Egyéb
  • Elosztott feldolgozás
    • Hadoop
      • HDFS mint elosztott fájlrendszer
      • MapReduce elosztott feldolgozáshoz
    • Spark
      • Minden-in-egy memóriabeli klaszter számítási keretrendszer nagyméretű adatfeldolgozáshoz
      • Strukturált adatfolyamok
      • Spark SQL
      • Gépi tanulás könyvtárak: MLlib
      • Grafikus feldolgozás GraphX-szel
  • Skálázhatóság
    • Nyilvános felhő
      • AWS, Google, Aliyun stb.
    • Privát felhő
      • OpenStack, Cloud Foundry stb.
    • Automatikus skálázhatóság

A megfelelő megoldás kiválasztása a problémára

A Big Data jövője

Összefoglalás és következő lépések

Követelmények

  • Általános matematikai ismeretek
  • Általános programozási ismeretek
  • Általános adatbázis ismeretek

Célközönség

  • Fejlesztők / programozók
  • IT tanácsadók
 35 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (7)

Közelgő kurzusok

Rokon kategóriák