Kurzusleírás

  1. Big data alapok
    • A Big Data és szerepe a vállalati világban
    • A Big Data stratégia fejlesztésének fázisai egy vállalaton belül
    • A Big Data holisztikus megközelítésének indoklása
    • A Big Data platformhoz szükséges összetevők
    • Big data tárolási megoldások
    • A hagyományos technológiák korlátai
    • Adatbázis típusok áttekintése
    • A Big Data négy dimenziója
  2. A Big Data hatása az üzleti életre
    • A Big Data üzleti jelentősége
    • A hasznos adatok kinyerésének kihívásai
    • A Big Data integrálása a hagyományos adatokkal
  3. Big data tárolási technológiák
    • Big data technológiák áttekintése
      • Adattárolási modellek
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • A megfelelő big data technológia kiválasztása
  4. Big data feldolgozása
    • Adatbázisokhoz való csatlakozás és adatok kinyerése
    • Adatok átalakítása és előkészítése a feldolgozáshoz
    • Hadoop MapReduce használata elosztott adatok feldolgozásához
    • Hadoop MapReduce feladatok monitorozása és végrehajtása
    • Hadoop elosztott fájlrendszer építőelemei
    • Mapreduce és Yarn
    • Streaming adatok kezelése Sparkkal
  5. Big data elemzési eszközök és technológiák
    • Hadoop programozása Pig Latin nyelven
    • Big data lekérdezése Hive segítségével
    • Adatbányászat Mahouttal
    • Vizualizációs és jelentéskészítő eszközök
  6. Big data az üzleti életben
    • Big Data igények kezelése és meghatározása
    • A Big Data üzleti jelentősége
    • A megfelelő big data eszköz kiválasztása a problémára

Adattárház fogalmak

  • Mi az adattárház?
  • Különbség az OLTP és az adattárház között
  • Adatgyűjtés
  • Adatkinyerés
  • Adatátalakítás.
  • Adatbetöltés
  • Adatmartok
  • Függő és független adatmart
  • Adatbázis tervezés

ETL tesztelési fogalmak:

  • Bevezetés.
  • Szoftverfejlesztési életciklus.
  • Tesztelési módszertanok.
  • ETL tesztelési munkafolyamat folyamat.
  • ETL tesztelési felelősségek Data stage-ben.       

Big data alapok

  • A Big Data és szerepe a vállalati világban
  • A Big Data stratégia fejlesztésének fázisai egy vállalaton belül
  • A Big Data holisztikus megközelítésének indoklása
  • A Big Data platformhoz szükséges összetevők
  • Big data tárolási megoldások
  • A hagyományos technológiák korlátai
  • Adatbázis típusok áttekintése

NoSQL adatbázisok

Hadoop

Map Reduce

Apache Spark

Követelmények

A résztvevőknek rendelkezniük kell tudással és némi gyakorlattal a tárolóeszközökkel kapcsolatban, valamint tisztában kell lenniük a nagy adathalmazok kezelésével.

 14 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák