Köszönjük, hogy elküldte érdeklődését! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Köszönjük, hogy elküldte foglalását! Csapatunk egyik tagja hamarosan felveszi Önnel a kapcsolatot.
Kurzusleírás
1: HDFS (17%)
- A HDFS démonok funkciójának leírása
- Az Apache Hadoop klaszter normál működésének leírása, mind adattárolási, mind adatfeldolgozási szempontból.
- A számítógépes rendszerek jelenlegi funkcióinak azonosítása, amelyek motiválják egy olyan rendszer létrehozását, mint az Apache Hadoop.
- A HDFS tervezési céljainak főbb pontjainak osztályozása
- Adott forgatókönyv esetén a HDFS Föderáció használati esetének azonosítása
- Egy HDFS HA-Quorum klaszter összetevőinek és démonjainak azonosítása
- A HDFS biztonság (Kerberos) szerepének elemzése
- Adott forgatókönyv esetén a legjobb adatszerializációs választás meghatározása
- Fájlok olvasási és írási útvonalának leírása
- A Hadoop Fájlrendszer Shellben használható fájlkezelési parancsok azonosítása
2: YARN és MapReduce 2. verzió (MRv2) (17%)
- A klaszter Hadoop 1-ről Hadoop 2-re történő frissítésének hatásainak megértése a klaszter beállításaira
- A MapReduce v2 (MRv2 / YARN) telepítésének megértése, beleértve az összes YARN démont
- A MapReduce v2 (MRv2) alapvető tervezési stratégiájának megértése
- A YARN erőforrás-allokációjának meghatározása
- A YARN-en futó MapReduce feladat munkafolyamatának azonosítása
- Annak meghatározása, hogy mely fájlokat kell módosítani és hogyan ahhoz, hogy egy klasztert MapReduce 1. verzióról (MRv1) MapReduce 2. verzióra (MRv2) telepítsünk YARN-en.
3: Hadoop klaszter tervezés (16%)
- Főbb szempontok, amelyeket figyelembe kell venni az Apache Hadoop klasztert üzemeltető hardver és operációs rendszer kiválasztásakor.
- Az operációs rendszer kiválasztásának lehetőségeinek elemzése
- A kernel hangolás és a lemezcsere megértése
- Adott forgatókönyv és munkaterhelési minta esetén a forgatókönyvnek megfelelő hardverkonfiguráció azonosítása
- Adott forgatókönyv esetén annak meghatározása, hogy mely ökoszisztéma-összetevőkre van szükség a klaszternek az SLA teljesítéséhez
- Klaszter méretezése: adott forgatókönyv és végrehajtási gyakoriság esetén a munkaterhelés specifikációinak azonosítása, beleértve a CPU-t, memóriát, tárterületet, lemez I/O-t
- Lemezméret és konfiguráció, beleértve a JBOD és RAID, SAN-ok, virtualizáció és lemezméret-követelmények egy klaszterben
- Hálózati topológiák: a hálózat használatának megértése a Hadoopban (mind HDFS, mind MapReduce esetén) és kulcsfontosságú hálózattervezési összetevők javaslata vagy azonosítása adott forgatókönyv esetén
4: Hadoop klaszter telepítés és adminisztráció (25%)
- Adott forgatókönyv esetén annak azonosítása, hogyan kezeli a klaszter a lemez- és géphibákat
- Egy naplókonfiguráció és naplókonfigurációs fájlformátum elemzése
- A Hadoop metrikák és klaszter egészségügyi monitorozás alapjainak megértése
- A rendelkezésre álló klasztermonitorozási eszközök funkciójának és céljának azonosítása
- Az összes ökoszisztéma-összetevő telepítésének képessége a CDH 5-ben, beleértve (de nem kizárólagosan): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive és Pig
- A rendelkezésre álló Apache Hadoop fájlrendszer-kezelő eszközök funkciójának és céljának azonosítása
5: Erőforrás-kezelés (10%)
- A Hadoop ütemezők tervezési céljainak megértése
- Adott forgatókönyv esetén annak meghatározása, hogyan allokálja a FIFO Scheduler a klaszter erőforrásait
- Adott forgatókönyv esetén annak meghatározása, hogyan allokálja a Fair Scheduler a klaszter erőforrásait YARN alatt
- Adott forgatókönyv esetén annak meghatározása, hogyan allokálja a Capacity Scheduler a klaszter erőforrásait
6: Monitorozás és naplózás (15%)
- A Hadoop metrikagyűjtési képességeinek funkcióinak és jellemzőinek megértése
- A NameNode és JobTracker Web felületek elemzése
- A klaszter démonok monitorozásának megértése
- A főcsomópontok CPU-használatának azonosítása és monitorozása
- A swap és memória-allokáció monitorozásának leírása az összes csomóponton
- A Hadoop naplófájljainak megtekintésének és kezelésének azonosítása
- Egy naplófájl értelmezése
Követelmények
- Alapvető Linux adminisztrációs ismeretek
- Alapvető programozási ismeretek
35 Órák
Vélemények (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczatka
Kurzus - Administrator Training for Apache Hadoop
Gépi fordítás
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Kurzus - Administrator Training for Apache Hadoop
Gépi fordítás
I mostly liked the trainer giving real live Examples.
Simon Hahn
Kurzus - Administrator Training for Apache Hadoop
Gépi fordítás