Kurzusleírás
1. szakasz: Bevezetés a Hadoopba
- Hadoop története, fogalmak
- ökoszisztéma
- disztribúciók
- magas szintű architektúra
- Hadoop mítoszok
- Hadoop kihívások
- hardver / szoftver
- labor: első pillantás a Hadoopra
2. szakasz: HDFS
- Tervezés és architektúra
- fogalmak (horizontális skálázás, replikáció, adat lokalitás, rack awareness)
- Daemonok: Namenode, Secondary namenode, Data node
- kommunikáció / szívverések
- adatintegritás
- olvasási / írási út
- Namenode magas rendelkezésre állás (HA), Föderáció
- labor: Kommunikáció a HDFS-sel
3. szakasz: Map Reduce
- fogalmak és architektúra
- daemonok (MRV1): jobtracker / tasktracker
- fázisok: driver, mapper, shuffle/sort, reducer
- Map Reduce 1. és 2. verzió (YARN)
- A Map Reduce belső működése
- Bevezetés a Java Map Reduce programozásba
- labor: Egy MapReduce program futtatása
4. szakasz: Pig
- pig vs java map reduce
- pig munkafolyamat
- pig latin nyelv
- ETL a Pig segítségével
- Transzformációk és joinok
- Felhasználó által definiált függvények (UDF)
- labor: Pig szkriptek írása adatelemzéshez
5. szakasz: Hive
- architektúra és tervezés
- adattípusok
- SQL támogatás a Hive-ban
- Hive táblák létrehozása és lekérdezése
- partíciók
- joinok
- szövegfeldolgozás
- labor: Különböző laborok adatfeldolgozással a Hive segítségével
6. szakasz: HBase
- fogalmak és architektúra
- HBase vs RDBMS vs Cassandra
- HBase Java API
- Idősoros adatok a HBase-ban
- séma tervezés
- labor: Kommunikáció a HBase-al a shell segítségével; programozás a HBase Java API-val; Séma tervezési gyakorlat
Követelmények
- otthonosnak kell lenni a Java programozási nyelvben (a legtöbb programozási feladat Java nyelven történik)
- otthonosnak kell lenni a Linux környezetben (képesnek kell lenni a Linux parancssor használatára, fájlok szerkesztésére vi vagy nano segítségével)
Laboratóriumi környezet
Nulla telepítés : Nincs szükség a Hadoop szoftver telepítésére a diákok gépeire! Egy működő Hadoop klaszter áll a diákok rendelkezésére.
A diákoknak a következőkre lesz szükségük
- egy SSH kliens (Linux és Mac rendszereken már rendelkezésre áll SSH kliens, Windows rendszerhez a Putty ajánlott)
- egy böngésző a klaszter eléréséhez, a Firefox ajánlott
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James minden lépésről részletesebben elmagyarázta nekem ahol is elakadtam. Teljesen új terület volt számomra a NIFI. Elmagyarázta a NIFI valódi célját, még az alapokat is, mint például az nyílt forráskódú szoftvereket. Minden fogalmat lefutattunk Nifi-vel, kezdőtől fejlesztőig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
Mint ahogy azt eleinte is tudtam.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
gyakorlati dolgokat is elvégezhetett, sőt Ajay jóképpen elméletet is tartott
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás
Nagyon tetszett a virtuális gép. A tanár nagyon tudatos volt a téma kapcsán és más témákra is, szíves és barátságos volt. Dubaiban lévő helyszínt is nagyon tetszett.
Safar Alqahtani - Elm Information Security
Kurzus - Big Data Analytics in Health
Gépi fordítás