Kurzusleírás

Szekció 1: Data Management az HDFS-ben

  • Többféle Adatformátum (JSON / Avro / Parquet)
  • Kompressziós módok
  • Adatábrázolás
  • Laborok: különböző adatformátumok elemzése; kompresszió engedélyezése

Szekció 2: Haladó Pig

  • Felhasználó által definiált függvények
  • Pig könyvtárak bevezetése (ElephantBird / Data-Fu)
  • Bonyolult szerkezetű adatok betöltése Piggel
  • Pig finomhangolása
  • Laborok: haladó Pig-szkriptelés, bonyolult adattípusok elemzése

Szekció 3: Haladó Hive

  • Felhasználó által definiált függvények
  • Kompressziós táblák
  • Hive teljesítményfinomhangolás
  • Laborok: kompressziós táblák létrehozása, táblamódok és konfigurációk értékelése

Szekció 4: Haladó HBase

  • Haladó schema modell készítése
  • Kompresszió
  • Tömeges adatbevitel
  • Széles táblák / magas táblák összehasonlítása
  • HBase és Pig
  • HBase és Hive
  • HBase teljesítményfinomhangolás
  • Laborok: HBase finomhangolása; HBase adatok hozzáférése Piggel és Hive-vel; Phoenix használata adatszint modell készítéséhez

Követelmények

  • Békén mozgatja magát Java programozási nyelv (a legtöbb programozási gyakorlat java nyelveken történik)
  • Békén mozog a Linux környezetben (tudjon navigálni a Linux parancssorban, szerkeszteni fájlokat vi / nano segítségével)
  • működő ismerete van Hadoop -nek.

Labor környezet

Nincs telepítés: Nincs szükség arra, hogy a hallgatók gépére telepítsük a hadoop szoftvert! A hallgatók rendelkezésére áll egy működőképes hadoop cluster.

A hallgatóknak a következőkre lesz szüksége

 21 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák