Kurzusleírás

Bevezetés az Data Analysis-be és a Big Databa

    Mitől lesz Big Data "nagy"? Sebesség, térfogat, változatosság, igazságosság (VVVV)
A hagyományos adatfeldolgozás korlátai
  • Elosztott feldolgozás
  • Statisztikai analízis
  • Az elemzés típusai Machine Learning
  • Data Visualization
  • Big Data Szerepek és felelősségek
  • Rendszergazdák Fejlesztők Adatelemzők

      Languages Adatelemzésre használják

    R Language Miért R az adatelemzés? Adatkezelés, számítás és grafikus megjelenítés

      Python Miért Python adatelemzésre?
    Adatok kezelése, feldolgozása, tisztítása és roppantása
  • Megközelítések Data Analysis
  • Statisztikai elemzés Idősor elemzés Előrejelzés korrelációs és regressziós modellekkel Következtető Statistics (becslés) Leíró Statistics Big Data halmazokban (pl. átlag kiszámítása)
  • Machine Learning Felügyelt és felügyelet nélküli tanulás

      Osztályozás és klaszterezés
    Konkrét módszerek költségének becslése
  • Szűrő
  • Természetes nyelvi feldolgozás Szöveg feldolgozása
  • A szöveg jelentésének megértése
  • Automatikus szöveggenerálás
  • Érzelemelemzés / témaelemzés
  • Computer Vision Képek beszerzése, feldolgozása, elemzése és megértése
  • 3D jelenetek rekonstruálása, értelmezése és megértése
  • Képadatok felhasználása döntések meghozatalához
  • Big Data Infrastruktúra
  • Adattárolás Relációs adatbázisok (SQL) MySQL Postgres Oracle
  • Nem relációs adatbázisok (NoSQL) Cassandra
  • MongoDB
  • Neo4js
  • Az árnyalatok megértése Hierarchikus adatbázisok

      Objektumorientált adatbázisok
    Dokumentumorientált adatbázisok
  • Gráf-orientált adatbázisok
  • Egyéb
  • Elosztott feldolgozás Hadoop A HDFS mint elosztott fájlrendszer
  • MapReduce az elosztott feldolgozáshoz
  • Spark All-in-one memória fürt számítási keretrendszer nagyszabású adatfeldolgozáshoz
  • Strukturált adatfolyam
  • Spark SQL
  • Machine Learning könyvtárak: MLlib
  • Grafikonfeldolgozás a GraphX segítségével
  • Scalaképesség Nyilvános felhő AWS, Google, Aliyun stb.Privát felhő OpenStack, Cloud Foundry stb.
  • Automatikus skálázhatóság
  • A megfelelő megoldás kiválasztása a problémára
  • Big Data jövője
  • Összefoglalás, és következtetés
  • Követelmények

    • A matematika általános megértése.
    • A programozás általános ismerete.
    • Az adatbázisok általános ismerete.

    Közönség

    • Fejlesztők / programozók
    • IT tanácsadók
     35 Hours

    Résztvevők száma



    Ár per résztvevő

    Vélemények (2)

    Rokon tanfolyam

    QGIS for Geographic Information System

    21 Hours

    Rokon kategóriák