Kurzusleírás
1. szakasz: Adattárgyalás az HDFS-ben
- Egyéb adatformátok (JSON / Avro / Parquet)
- Tömörítési séma
- Adatmaszkolódás
- Gyakorlat: különböző adatformátumok elemzése; tömörítés engedélyezése
2. szakasz: Fejlett Pig
- Felhasználói függvények
- Egy bevezetés a Pig könyvtárakba (ElephantBird / Data-Fu)
- Összetett strukturált adatok betöltése Pig segítségével
- Pig hangolása
- Gyakorlat: fejlett Pig szkriptek írása, összetett adattípusok elemzése
3. szakasz: Fejlett Hive
- Felhasználói függvények
- Tömörített táblák
- Hive teljesítményhangolása
- Gyakorlat: tömörített táblák létrehozása, táblatípusok és konfiguráció értékelése
4. szakasz: Fejlett HBase
- Fejlett séma modellezés
- Tömörítés
- Tömeges adatbevitel
- Széles-táblázatok és magas-táblázatok összevetése
- HBase és Pig
- HBase és Hive
- HBase teljesítményhangolása
- Gyakorlat: HBase hangolása; HBase adatok elérésének megvalósítása Pig és Hive segítségével; Phoenix használata az adatmodellezéshez
Követelmények
- kényelmes a Java programozási nyelv használatában (a legtöbb programozási gyakorlat java-ban van)
- kényelmes a Linux környezetben (képesség Linux parancssori navigálásra, fájlok szerkesztésére vi vagy nano használatával)
- működőképes ismeret a Hadoop-ról.
Labor környezet
Nulla telepítés: Nem szükséges hadoop-szoftverek telepítése a tanulók gépeire! A tanulóknak működő Hadoop-klaszter lesz nyújtva.
A tanulóknak a következőkre van szükségük
Vélemények (5)
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James részletesen magamnak is magyarázta, amikor akadtam, hogy mit is csináljunk. Én teljesen újonc voltam a NIFI-ban. James elmagyarázta a NIFI valódi célját, még az alapokat is, mint például, hogy miért nyílt forráskódú. Átnézte minden Nifi fogalmat kezdő szinttől a fejlesztői szintig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
Azt, hogy elejétől is voltam birtokában.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
Az elméleti anyag is kiválóan szolgált ajtón át Ajay által
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás
A VM-t nagyon tetszett nekem. Az oktató rendkívül jól tudott a tárgyról, és más témákról is, nagyon kedves és barátságos volt. Szerettem volna a Dubajban lévő létesítményt.
Safar Alqahtani - Elm Information Security
Kurzus - Big Data Analytics in Health
Gépi fordítás