Kurzusleírás

1. szakasz: Bevezetés a Hadoop-ba

  • Hadoop története, fogalmai
  • ökoszisztémák
  • bontások
  • magas szintű architektúra
  • Hadoop mitológiai ábrázolásai
  • Hadoop kihívásai
  • hardver / szoftver
  • lab : első pillantás Hadoop-re

2. szakasz: HDFS

  • Tervezés és architektúra
  • fogalmak (vízszintes méretezhetőség, replikáció, adat helyzetessége, rack felismerés)
  • Démonok : Namenode, Secondary namenode, Data node
  • kommunikációk / szívverek
  • adategészség
  • olvasás / írás útvonalak
  • Namenode magas elérhetősége (HA), Federáció
  • labs : Interakció HDFS-vel

3. szakasz: Térkép csökkentése

  • koncepciók és építészet
  • démonok (MRV1): jobtracker / tasktracker
  • fázisok: vezető, térképező, keverés/rendezés, reduktor
  • Map Reduce 1. és 2. verzió (YARN)
  • A Map Reduce belső elemei
  • Bevezetés a Java Map Reduce programba
  • labs : MapReduce mintaprogram futtatása

4. szakasz: Sertés

  • pig vs java térkép csökkentése
  • disznó munkafolyamat
  • disznó latin nyelv
  • ETL malaccal
  • Átalakítások és csatlakozások
  • Felhasználó által definiált függvények (UDF)
  • Labs: Pig szkriptek írása az adatok elemzéséhez

5. szakasz: Hive

  • építészet és tervezés
  • adattípusok
  • SQL támogatás itt: Hive
  • Hive tábla készítése és lekérdezés
  • válaszfalak
  • csatlakozik
  • szövegfeldolgozás
  • laborok : különféle laboratóriumok az adatok feldolgozásával kapcsolatban Hive

6. szakasz: HBase

  • fogalmak és architektúra
  • HBase vs RDBMS vs Cassandra
  • HBase Java API
  • Időszakos adatok HBase-on
  • sématervezés
  • labs : Interakció HBase shell használatával; programozás HBase Java API-val ; sématervezés gyakorlása

Követelmények

  • jól ismeri a Java programozási nyelvet (a legtöbb programozási gyakorlat java-ban van)
  • kényelmesen Linux környezetben (lehet navigálni Linux parancssorban, szerkeszteni a fájlokat a vi / nano segítségével)

Labor környezet

Nulla telepítés : Nincs szükség a diákok gépeire Hadoop szoftverek telepítésére! A diákoknak egy működő Hadoop klúster lesz kínálva.

A tanulóknak a következőkre lesz szükségük

  • egy SSH ügyfél (Linux és Mac már rendelkezik ssh ügyfelekkel, Windows esetén ajánlott Putty)
  • böngésző a klúster eléréséhez, ajánlott Firefox
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák