Kurzusleírás
1. szakasz: Bevezetés a Hadoop-ba
- Hadoop története, fogalmai
- ökoszisztémája
- distribúciók
- magas szintű architektúra
- Hadoop mítoszai
- Hadoop kihívásai
- hardver/szoftver
- gyakorlat : első ismerkedés a Hadoop-val
2. szakasz: HDFS
- tervezése és architektúrája
- fogalmak (vízszintes skálázás, replikáció, adat helyi elérése, hordozókészlet tisztázása)
- démonok : Namenode, Secondary namenode, Data node
- kapcsolatok / élethüvelyek (heartbeat)
- adat integritás
- olvasási/írási útvonalak
- Namenode High Availability (HA), Federation
- gyakorlat : HDFS működésének vizsgálata
3. szakasz: Map Reduce
- fogalmak és architektúra
- démonok (MRV1) : jobtracker, tasktracker
- szakaszok : vezető, mapelőkészítő, rendezés/összeállítás, csökkentő
- Map Reduce verzió 1 és verzió 2 (YARN)
- Map Reduce belső működése
- Bevezetés a Java Map Reduce programba
- gyakorlat : minta MapReduce program futtatása
4. szakasz: Pig
- pig vs java map reduce
- Pig munkafolyamatai
- Pig Latin nyelv
- ETL a Piggel
- Átalakítások és csatlakoztatások
- Felhasználó által definiált függvények (UDF)
- gyakorlat : Pig szkriptek írása az adat elemzéséhez
5. szakasz: Hive
- architektúra és tervezése
- adattípusok
- SQL támogatás a Hive-ban
- Hive táblák létrehozása és lekérdezése
- partíciók
- csatlakoztatások
- szövegfeldolgozás
- gyakorlat : különböző gyakorlatok az adatfeldolgozásra a Hive-ban
6. szakasz: HBase
- fogalmak és architektúra
- HBase vs RDBMS vs Cassandra
- HBase Java API
- IDőbeli adatok a HBase-ben
- sématervezés
- gyakorlat : interakciók a HBase shell-lel; programozás a HBase Java API-vel; sématervezés gyakorlása
Követelmények
- megbízható a Java programozási nyelvben (a legtöbb programozási gyakorlat java-ban van)
- megbízható Linux környezetben (képes Linux parancssori navigálásra, fájlok szerkesztésére vi vagy nano használatával)
Labor környezet
Nulla telepítés : Nincs szükség a Hadoop szoftver telepítésére az osztályozók gépeire! Egy működő Hadoop klaszter lesz rendelkezésre a tanulók számára.
A tanulóknak a következőkre lesz szükségük:
- egy SSH klienst (Linux és Mac már rendelkezik ssh kliensekkel, Windows esetén a Putty ajánlott)
- egy böngészőt a klaszter eléréséhez, Firefox ajánlott
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James minden lépésről részletesebben elmagyarázta nekem ahol is elakadtam. Teljesen új terület volt számomra a NIFI. Elmagyarázta a NIFI valódi célját, még az alapokat is, mint például az nyílt forráskódú szoftvereket. Minden fogalmat lefutattunk Nifi-vel, kezdőtől fejlesztőig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
Mint ahogy azt eleinte is tudtam.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
gyakorlati dolgokat is elvégezhetett, sőt Ajay jóképpen elméletet is tartott
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás
Nagyon tetszett a virtuális gép. A tanár nagyon tudatos volt a téma kapcsán és más témákra is, szíves és barátságos volt. Dubaiban lévő helyszínt is nagyon tetszett.
Safar Alqahtani - Elm Information Security
Kurzus - Big Data Analytics in Health
Gépi fordítás