Kurzusleírás
1. szakasz: Adattárgyalás az HDFS-ben
- Egyéb adatformátok (JSON / Avro / Parquet)
- Tömörítési séma
- Adatmaszkolódás
- Gyakorlat: különböző adatformátumok elemzése; tömörítés engedélyezése
2. szakasz: Fejlett Pig
- Felhasználói függvények
- Egy bevezetés a Pig könyvtárakba (ElephantBird / Data-Fu)
- Összetett strukturált adatok betöltése Pig segítségével
- Pig hangolása
- Gyakorlat: fejlett Pig szkriptek írása, összetett adattípusok elemzése
3. szakasz: Fejlett Hive
- Felhasználói függvények
- Tömörített táblák
- Hive teljesítményhangolása
- Gyakorlat: tömörített táblák létrehozása, táblatípusok és konfiguráció értékelése
4. szakasz: Fejlett HBase
- Fejlett séma modellezés
- Tömörítés
- Tömeges adatbevitel
- Széles-táblázatok és magas-táblázatok összevetése
- HBase és Pig
- HBase és Hive
- HBase teljesítményhangolása
- Gyakorlat: HBase hangolása; HBase adatok elérésének megvalósítása Pig és Hive segítségével; Phoenix használata az adatmodellezéshez
Követelmények
- kényelmes a Java programozási nyelv használatában (a legtöbb programozási gyakorlat java-ban van)
- kényelmes a Linux környezetben (képesség Linux parancssori navigálásra, fájlok szerkesztésére vi vagy nano használatával)
- működőképes ismeret a Hadoop-ról.
Labor környezet
Nulla telepítés: Nem szükséges hadoop-szoftverek telepítése a tanulók gépeire! A tanulóknak működő Hadoop-klaszter lesz nyújtva.
A tanulóknak a következőkre van szükségük
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James minden lépésről részletesebben elmagyarázta nekem ahol is elakadtam. Teljesen új terület volt számomra a NIFI. Elmagyarázta a NIFI valódi célját, még az alapokat is, mint például az nyílt forráskódú szoftvereket. Minden fogalmat lefutattunk Nifi-vel, kezdőtől fejlesztőig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
Mint ahogy azt eleinte is tudtam.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
gyakorlati dolgokat is elvégezhetett, sőt Ajay jóképpen elméletet is tartott
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás
Nagyon tetszett a virtuális gép. A tanár nagyon tudatos volt a téma kapcsán és más témákra is, szíves és barátságos volt. Dubaiban lévő helyszínt is nagyon tetszett.
Safar Alqahtani - Elm Information Security
Kurzus - Big Data Analytics in Health
Gépi fordítás