Kurzusleírás
1. szakasz: Data Management HDFS-ben
- Különféle adatformátumok (JSON/Avro/Parquet)
- Tömörítési sémák
- Adatmaszkolás
- Labs : Különböző adatformátumok elemzése; tömörítést tesz lehetővé
2. szakasz: Advanced Pig
- Felhasználó által definiált funkciók
- Bevezetés a sertéskönyvtárakba (ElephantBird / Data-Fu)
- Összetett strukturált adatok betöltése a Pig segítségével
- Pig Tuning
- Labs : fejlett pig scripting, összetett adattípusok elemzése
3. szakasz: Haladó Hive
- Felhasználó által definiált funkciók
- Tömörített táblázatok
- Hive Teljesítményhangolás
- Labs: tömörített táblázatok létrehozása, táblázatformátumok és konfigurációk kiértékelése
4. szakasz: Speciális HBase
- Speciális sémamodellezés
- Tömörítés
- Tömeges adatfeldolgozás
- Széles asztal / magas asztal összehasonlítása
- HBase és Pig
- HBase és Hive
- HBase teljesítményhangolás
- Labs : HBase hangolása; HBase adatok elérése a Pig & Hive; A Phoenix használata adatmodellezéshez
Követelmények
- jól ismeri az Java programozási nyelvet (a legtöbb programozási gyakorlat java-ban van)
- kényelmes a Linux környezetben (tudjon navigálni Linux parancssorban, szerkeszteni a fájlokat a vi / nano segítségével)
- a Hadoop munkaismerete.
Labor környezet
Nulla telepítés: Nem kell hadoop szoftvert telepíteni a hallgatók gépére! A tanulók számára egy működő hadoop klasztert biztosítunk.
A tanulóknak a következőkre lesz szükségük
- SSH-kliens (Linux és Mac-ben már vannak ssh-kliensek, Windowshoz a Putty ajánlott)
- egy böngésző a fürt eléréséhez. Javasoljuk a Firefox böngészőt
Vélemények (5)
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
A gyakorlatok során James részletesen magamnak is magyarázta, amikor akadtam, hogy mit is csináljunk. Én teljesen újonc voltam a NIFI-ban. James elmagyarázta a NIFI valódi célját, még az alapokat is, mint például, hogy miért nyílt forráskódú. Átnézte minden Nifi fogalmat kezdő szinttől a fejlesztői szintig.
Firdous Hashim Ali - MOD A BLOCK
Kurzus - Apache NiFi for Administrators
Gépi fordítás
A tanárképző anyagok előkészítése és szervezése, valamint a GitHub-on megosztott anyagok minősége.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
Gépi fordítás
Azt, hogy elejétől is voltam birtokában.
Peter Scales - CACI Ltd
Kurzus - Apache NiFi for Developers
Gépi fordítás
Az elméleti anyag is kiválóan szolgált ajtón át Ajay által
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás