Kurzusleírás
1. szakasz: Bevezetés a Hadoop-ba
- Hadoop története, fogalmai
- ökoszisztémák
- bontások
- magas szintű architektúra
- Hadoop mitológiai ábrázolásai
- Hadoop kihívásai
- hardver / szoftver
- lab : első pillantás Hadoop-re
2. szakasz: HDFS
- Tervezés és architektúra
- fogalmak (vízszintes méretezhetőség, replikáció, adat helyzetessége, rack felismerés)
- Démonok : Namenode, Secondary namenode, Data node
- kommunikációk / szívverek
- adategészség
- olvasás / írás útvonalak
- Namenode magas elérhetősége (HA), Federáció
- labs : Interakció HDFS-vel
3. szakasz: Térkép csökkentése
- koncepciók és építészet
- démonok (MRV1): jobtracker / tasktracker
- fázisok: vezető, térképező, keverés/rendezés, reduktor
- Map Reduce 1. és 2. verzió (YARN)
- A Map Reduce belső elemei
- Bevezetés a Java Map Reduce programba
- labs : MapReduce mintaprogram futtatása
4. szakasz: Sertés
- pig vs java térkép csökkentése
- disznó munkafolyamat
- disznó latin nyelv
- ETL malaccal
- Átalakítások és csatlakozások
- Felhasználó által definiált függvények (UDF)
- Labs: Pig szkriptek írása az adatok elemzéséhez
5. szakasz: Hive
- építészet és tervezés
- adattípusok
- SQL támogatás itt: Hive
- Hive tábla készítése és lekérdezés
- válaszfalak
- csatlakozik
- szövegfeldolgozás
- laborok : különféle laboratóriumok az adatok feldolgozásával kapcsolatban Hive
6. szakasz: HBase
- fogalmak és architektúra
- HBase vs RDBMS vs Cassandra
- HBase Java API
- Időszakos adatok HBase-on
- sématervezés
- labs : Interakció HBase shell használatával; programozás HBase Java API-val ; sématervezés gyakorlása
Követelmények
- jól ismeri a Java programozási nyelvet (a legtöbb programozási gyakorlat java-ban van)
- kényelmesen Linux környezetben (lehet navigálni Linux parancssorban, szerkeszteni a fájlokat a vi / nano segítségével)
Labor környezet
Nulla telepítés : Nincs szükség a diákok gépeire Hadoop szoftverek telepítésére! A diákoknak egy működő Hadoop klúster lesz kínálva.
A tanulóknak a következőkre lesz szükségük
- egy SSH ügyfél (Linux és Mac már rendelkezik ssh ügyfelekkel, Windows esetén ajánlott Putty)
- böngésző a klúster eléréséhez, ajánlott Firefox
Vélemények (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay