Kurzusleírás
1. szakasz: Bevezetés a Hadoop-ba
- hadoop történelem, fogalmak
- öko rendszer
- disztribúciók
- magas szintű architektúra
- hadoop mítoszok
- hadoop kihívások
- hardver szoftver
- labor : első pillantás a Hadoop-ra
2. szakasz: HDFS
- Tervezés és építészet
- fogalmak (vízszintes méretezés, replikáció, adatlokalitás, rack tudatosság)
- Démonok: névcsomópont, másodlagos névcsomópont, adatcsomópont
- kommunikáció / szívverések
- adatintegritás
- olvasási / írási útvonal
- Namenode High Availability (HA), Federation
- labs: interakció a HDFS-szel
3. szakasz: Térkép csökkentése
- koncepciók és építészet
- démonok (MRV1): jobtracker / tasktracker
- fázisok: vezető, térképező, keverés/rendezés, reduktor
- Map Reduce 1. és 2. verzió (YARN)
- A Map Reduce belső elemei
- Bevezetés a Java Map Reduce programba
- labs : MapReduce mintaprogram futtatása
4. szakasz: Sertés
- pig vs java térkép csökkentése
- disznó munkafolyamat
- disznó latin nyelv
- ETL malaccal
- Átalakítások és csatlakozások
- Felhasználó által definiált függvények (UDF)
- Labs: Pig szkriptek írása az adatok elemzéséhez
5. szakasz: Hive
- építészet és design
- adattípusok
- SQL támogatás itt: Hive
- Hive tábla készítése és lekérdezés
- válaszfalak
- csatlakozik
- szövegfeldolgozás
- laborok : különféle laboratóriumok az adatok feldolgozásával kapcsolatban Hive
6. szakasz: HBase
- koncepciók és építészet
- hbase vs RDBMS vs cassandra
- HBase Java API
- Idősor adatok a HBase-en
- séma tervezés
- laborok: interakció a HBase-sel shell használatával; programozás HBase-ben Java API ; Sématervezési gyakorlat
Követelmények
- jól ismeri a Java programozási nyelvet (a legtöbb programozási gyakorlat java nyelven van)
- kényelmesen Linux környezetben (lehet navigálni Linux parancssorban, szerkeszteni a fájlokat a vi / nano segítségével)
Labor környezet
Nulla telepítés : Nem kell hadoop szoftvert telepíteni a hallgatók gépére! A tanulók számára egy működő hadoop klasztert biztosítunk.
A tanulóknak a következőkre lesz szükségük
- SSH-kliens (Linux és Mac már rendelkeznek ssh-kliensekkel, Windowshoz a Putty ajánlott)
- egy böngésző a fürt eléréséhez. Javasoljuk a Firefox böngészőt
Vélemények (6)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
I thought he did a great job of tailoring the experience to the audience. This class is mostly designed to cover data analysis with HIVE, but me and my co-worker are doing HIVE administration with no real data analytics responsibilities.
ian reif - Franchise Tax Board
Kurzus - Data Analysis with Hive/HiveQL
Many hands-on sessions.
Jacek Pieczątka
Kurzus - Administrator Training for Apache Hadoop
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurzus - Big Data Analytics in Health
The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.
vyzVoice
Kurzus - Hadoop for Developers and Administrators
practical things of doing, also theory was served good by Ajay