Kurzusleírás
Szekció 1: Data Management az HDFS-ben
- Többféle Adatformátum (JSON / Avro / Parquet)
- Kompressziós módok
- Adatábrázolás
- Laborok: különböző adatformátumok elemzése; kompresszió engedélyezése
Szekció 2: Haladó Pig
- Felhasználó által definiált függvények
- Pig könyvtárak bevezetése (ElephantBird / Data-Fu)
- Bonyolult szerkezetű adatok betöltése Piggel
- Pig finomhangolása
- Laborok: haladó Pig-szkriptelés, bonyolult adattípusok elemzése
Szekció 3: Haladó Hive
- Felhasználó által definiált függvények
- Kompressziós táblák
- Hive teljesítményfinomhangolás
- Laborok: kompressziós táblák létrehozása, táblamódok és konfigurációk értékelése
Szekció 4: Haladó HBase
- Haladó schema modell készítése
- Kompresszió
- Tömeges adatbevitel
- Széles táblák / magas táblák összehasonlítása
- HBase és Pig
- HBase és Hive
- HBase teljesítményfinomhangolás
- Laborok: HBase finomhangolása; HBase adatok hozzáférése Piggel és Hive-vel; Phoenix használata adatszint modell készítéséhez
Követelmények
- Békén mozgatja magát Java programozási nyelv (a legtöbb programozási gyakorlat java nyelveken történik)
- Békén mozog a Linux környezetben (tudjon navigálni a Linux parancssorban, szerkeszteni fájlokat vi / nano segítségével)
- működő ismerete van Hadoop -nek.
Labor környezet
Nincs telepítés: Nincs szükség arra, hogy a hallgatók gépére telepítsük a hadoop szoftvert! A hallgatók rendelkezésére áll egy működőképes hadoop cluster.
A hallgatóknak a következőkre lesz szüksége
Vélemények (5)
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James részletesen magamnak is magyarázta, amikor akadtam, hogy mit is csináljunk. Én teljesen újonc voltam a NIFI-ban. James elmagyarázta a NIFI valódi célját, még az alapokat is, mint például, hogy miért nyílt forráskódú. Átnézte minden Nifi fogalmat kezdő szinttől a fejlesztői szintig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
A tanárképző anyagok előkészítése és szervezése, valamint a GitHub-on megosztott anyagok minősége.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
Gépi fordítás
Azt, hogy elejétől is voltam birtokában.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
Az elméleti anyag is kiválóan szolgált ajtón át Ajay által
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás