Kurzusleírás
1. szakasz: Adatkezelés a HDFS-ben
- Különböző adatformátumok (JSON / Avro / Parquet)
- Tömörítési sémák
- Adatmaszkolás
- Laborok: Különböző adatformátumok elemzése; tömörítés engedélyezése
2. szakasz: Haladó Pig
- Felhasználó által definiált függvények
- Bevezetés a Pig könyvtárakba (ElephantBird / Data-Fu)
- Komplex strukturált adatok betöltése Pig segítségével
- Pig finomhangolása
- Laborok: haladó Pig szkriptelés, komplex adattípusok elemzése
3. szakasz: Haladó Hive
- Felhasználó által definiált függvények
- Tömörített táblák
- Hive teljesítményfinomítás
- Laborok: tömörített táblák létrehozása, táblaformátumok és konfigurációk értékelése
4. szakasz: Haladó HBase
- Haladó sémamodellezés
- Tömörítés
- Tömeges adatbetöltés
- Széles tábla / magas tábla összehasonlítás
- HBase és Pig
- HBase és Hive
- HBase teljesítményfinomítás
- Laborok: HBase finomhangolása; HBase adatok elérése Pig és Hive segítségével; Phoenix használata adatmodellezéshez
Követelmények
- kényelmes Java programozási nyelv használata (a legtöbb programozási gyakorlat Java nyelven történik)
- kényelmes Linux környezetben való működés (képes navigálni a Linux parancssorban, szerkeszteni fájlokat vi / nano használatával)
- alapvető Hadoop ismeretek.
Laboratóriumi környezet
Nulla telepítés: Nincs szükség Hadoop szoftver telepítésére a hallgatók gépeire! Egy működő Hadoop klaszter áll a hallgatók rendelkezésére.
A hallgatóknak a következőkre lesz szükségük
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James minden lépésről részletesebben elmagyarázta nekem ahol is elakadtam. Teljesen új terület volt számomra a NIFI. Elmagyarázta a NIFI valódi célját, még az alapokat is, mint például az nyílt forráskódú szoftvereket. Minden fogalmat lefutattunk Nifi-vel, kezdőtől fejlesztőig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
Mint ahogy azt eleinte is tudtam.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
gyakorlati dolgokat is elvégezhetett, sőt Ajay jóképpen elméletet is tartott
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás
Nagyon tetszett a virtuális gép. A tanár nagyon tudatos volt a téma kapcsán és más témákra is, szíves és barátságos volt. Dubaiban lévő helyszínt is nagyon tetszett.
Safar Alqahtani - Elm Information Security
Kurzus - Big Data Analytics in Health
Gépi fordítás