Kurzusleírás

1. szakasz: Bevezetés az Hadoop-be

  • Hadoop története, fogalmai
  • ökoszisztéma
  • disztribúciók
  • magas szintű architektúra
  • Hadoop mítoszok
  • Hadoop kihívások
  • hardware / software
  • labor: első látogatás az Hadoop-ben

2. szakasz: HDFS

  • Tervezés és architektúra
  • fogalmak (horizontális skalálás, replikáció, adathelyesség, rack tudatosság)
  • Daemons : Namenode, Második Namenode, Data Node
  • kommunikáció / szívverések
  • adatintegritás
  • olvasás / írási útvonal
  • Namenode High Availability (HA), Federáció
  • laborok: HDFS használata

3. szakasz: Map Reduce

  • fogalmak és architektúra
  • daemons (MRV1) : jobtracker / tasktracker
  • fázisok: driver, mapper, shuffle/sort, reducer
  • Map Reduce V1 és V2 (YARN)
  • Map Reduce belső működése
  • Java Map Reduce program bevezetése
  • laborok: egy példa MapReduce program futtatása

4. szakasz: Pig

  • pig vs java map reduce
  • pig munkafolyam
  • pig latin nyelv
  • ETL Piggel
  • átalakítások és csatlakozások
  • felhasználó által definiált függvények (UDF)
  • laborok: Pig-skript írása adatok elemzésére

5. szakasz: Hive

  • architektúra és tervezés
  • adat típusok
  • SQL támogatás az Hive-ben
  • Hive táblák létrehozása és lekérdezése
  • partíciók
  • csatlakozások
  • szövegfeldolgozás
  • laborok: különböző laborok adatok feldolgozásához az Hive-vel

6. szakasz: HBase

  • fogalmak és architektúra
  • HBase vs RDBMS vs Cassandra
  • HBase Java API
  • időszéries adatok HBase-ben
  • séma tervezés
  • laborok: HBase használata a shell segítségével; programozás HBase Java API-ben; Séma tervezési gyakorlat

Követelmények

  • békén mozgatja magát a Java programozási nyelvben (a legtöbb programozási gyakorlat java nyelven történik)
  • békén mozog a Linux környezetben (tudja a Linux parancssor navigálását, tudja a vi / nano használatát a fájlok szerkesztésére)

Laboratóriumi környezet

Nulla telepítés : Nincs szükség arra, hogy a Hadoop szoftvert telepítsék a diákok gépeire! A diákoknak egy működő Hadoop cluster lesz biztosítva.

A diákoknak a következőket kell rendelkezniük:

  • SSH kliens (Linux és Mac már rendelkezik ssh klienssel, Windows esetén a Putty ajánlott)
  • böngésző a cluster eléréséhez, ajánlott a Firefox
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák