Kurzusleírás
1. szakasz: Bevezetés az Hadoop-be
- Hadoop története, fogalmai
- ökoszisztéma
- disztribúciók
- magas szintű architektúra
- Hadoop mítoszok
- Hadoop kihívások
- hardware / software
- labor: első látogatás az Hadoop-ben
2. szakasz: HDFS
- Tervezés és architektúra
- fogalmak (horizontális skalálás, replikáció, adathelyesség, rack tudatosság)
- Daemons : Namenode, Második Namenode, Data Node
- kommunikáció / szívverések
- adatintegritás
- olvasás / írási útvonal
- Namenode High Availability (HA), Federáció
- laborok: HDFS használata
3. szakasz: Map Reduce
- fogalmak és architektúra
- daemons (MRV1) : jobtracker / tasktracker
- fázisok: driver, mapper, shuffle/sort, reducer
- Map Reduce V1 és V2 (YARN)
- Map Reduce belső működése
- Java Map Reduce program bevezetése
- laborok: egy példa MapReduce program futtatása
4. szakasz: Pig
- pig vs java map reduce
- pig munkafolyam
- pig latin nyelv
- ETL Piggel
- átalakítások és csatlakozások
- felhasználó által definiált függvények (UDF)
- laborok: Pig-skript írása adatok elemzésére
5. szakasz: Hive
- architektúra és tervezés
- adat típusok
- SQL támogatás az Hive-ben
- Hive táblák létrehozása és lekérdezése
- partíciók
- csatlakozások
- szövegfeldolgozás
- laborok: különböző laborok adatok feldolgozásához az Hive-vel
6. szakasz: HBase
- fogalmak és architektúra
- HBase vs RDBMS vs Cassandra
- HBase Java API
- időszéries adatok HBase-ben
- séma tervezés
- laborok: HBase használata a shell segítségével; programozás HBase Java API-ben; Séma tervezési gyakorlat
Követelmények
- békén mozgatja magát a Java programozási nyelvben (a legtöbb programozási gyakorlat java nyelven történik)
- békén mozog a Linux környezetben (tudja a Linux parancssor navigálását, tudja a vi / nano használatát a fájlok szerkesztésére)
Laboratóriumi környezet
Nulla telepítés : Nincs szükség arra, hogy a Hadoop szoftvert telepítsék a diákok gépeire! A diákoknak egy működő Hadoop cluster lesz biztosítva.
A diákoknak a következőket kell rendelkezniük:
- SSH kliens (Linux és Mac már rendelkezik ssh klienssel, Windows esetén a Putty ajánlott)
- böngésző a cluster eléréséhez, ajánlott a Firefox
Vélemények (5)
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James részletesen magamnak is magyarázta, amikor akadtam, hogy mit is csináljunk. Én teljesen újonc voltam a NIFI-ban. James elmagyarázta a NIFI valódi célját, még az alapokat is, mint például, hogy miért nyílt forráskódú. Átnézte minden Nifi fogalmat kezdő szinttől a fejlesztői szintig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
A tanárképző anyagok előkészítése és szervezése, valamint a GitHub-on megosztott anyagok minősége.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
Gépi fordítás
Azt, hogy elejétől is voltam birtokában.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
Az elméleti anyag is kiválóan szolgált ajtón át Ajay által
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás