Kurzusleírás

1: HDFS (17%)

  • A HDFS démonok funkciójának leírása
  • Az Apache Hadoop klaszter normál működésének leírása, mind adattárolási, mind adatfeldolgozási szempontból.
  • A számítógépes rendszerek jelenlegi funkcióinak azonosítása, amelyek motiválják egy olyan rendszer létrehozását, mint az Apache Hadoop.
  • A HDFS tervezési céljainak főbb pontjainak osztályozása
  • Adott forgatókönyv esetén a HDFS Föderáció használati esetének azonosítása
  • Egy HDFS HA-Quorum klaszter összetevőinek és démonjainak azonosítása
  • A HDFS biztonság (Kerberos) szerepének elemzése
  • Adott forgatókönyv esetén a legjobb adatszerializációs választás meghatározása
  • Fájlok olvasási és írási útvonalának leírása
  • A Hadoop Fájlrendszer Shellben használható fájlkezelési parancsok azonosítása

2: YARN és MapReduce 2. verzió (MRv2) (17%)

  • A klaszter Hadoop 1-ről Hadoop 2-re történő frissítésének hatásainak megértése a klaszter beállításaira
  • A MapReduce v2 (MRv2 / YARN) telepítésének megértése, beleértve az összes YARN démont
  • A MapReduce v2 (MRv2) alapvető tervezési stratégiájának megértése
  • A YARN erőforrás-allokációjának meghatározása
  • A YARN-en futó MapReduce feladat munkafolyamatának azonosítása
  • Annak meghatározása, hogy mely fájlokat kell módosítani és hogyan ahhoz, hogy egy klasztert MapReduce 1. verzióról (MRv1) MapReduce 2. verzióra (MRv2) telepítsünk YARN-en.

3: Hadoop klaszter tervezés (16%)

  • Főbb szempontok, amelyeket figyelembe kell venni az Apache Hadoop klasztert üzemeltető hardver és operációs rendszer kiválasztásakor.
  • Az operációs rendszer kiválasztásának lehetőségeinek elemzése
  • A kernel hangolás és a lemezcsere megértése
  • Adott forgatókönyv és munkaterhelési minta esetén a forgatókönyvnek megfelelő hardverkonfiguráció azonosítása
  • Adott forgatókönyv esetén annak meghatározása, hogy mely ökoszisztéma-összetevőkre van szükség a klaszternek az SLA teljesítéséhez
  • Klaszter méretezése: adott forgatókönyv és végrehajtási gyakoriság esetén a munkaterhelés specifikációinak azonosítása, beleértve a CPU-t, memóriát, tárterületet, lemez I/O-t
  • Lemezméret és konfiguráció, beleértve a JBOD és RAID, SAN-ok, virtualizáció és lemezméret-követelmények egy klaszterben
  • Hálózati topológiák: a hálózat használatának megértése a Hadoopban (mind HDFS, mind MapReduce esetén) és kulcsfontosságú hálózattervezési összetevők javaslata vagy azonosítása adott forgatókönyv esetén

4: Hadoop klaszter telepítés és adminisztráció (25%)

  • Adott forgatókönyv esetén annak azonosítása, hogyan kezeli a klaszter a lemez- és géphibákat
  • Egy naplókonfiguráció és naplókonfigurációs fájlformátum elemzése
  • A Hadoop metrikák és klaszter egészségügyi monitorozás alapjainak megértése
  • A rendelkezésre álló klasztermonitorozási eszközök funkciójának és céljának azonosítása
  • Az összes ökoszisztéma-összetevő telepítésének képessége a CDH 5-ben, beleértve (de nem kizárólagosan): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive és Pig
  • A rendelkezésre álló Apache Hadoop fájlrendszer-kezelő eszközök funkciójának és céljának azonosítása

5: Erőforrás-kezelés (10%)

  • A Hadoop ütemezők tervezési céljainak megértése
  • Adott forgatókönyv esetén annak meghatározása, hogyan allokálja a FIFO Scheduler a klaszter erőforrásait
  • Adott forgatókönyv esetén annak meghatározása, hogyan allokálja a Fair Scheduler a klaszter erőforrásait YARN alatt
  • Adott forgatókönyv esetén annak meghatározása, hogyan allokálja a Capacity Scheduler a klaszter erőforrásait

6: Monitorozás és naplózás (15%)

  • A Hadoop metrikagyűjtési képességeinek funkcióinak és jellemzőinek megértése
  • A NameNode és JobTracker Web felületek elemzése
  • A klaszter démonok monitorozásának megértése
  • A főcsomópontok CPU-használatának azonosítása és monitorozása
  • A swap és memória-allokáció monitorozásának leírása az összes csomóponton
  • A Hadoop naplófájljainak megtekintésének és kezelésének azonosítása
  • Egy naplófájl értelmezése

Követelmények

  • Alapvető Linux adminisztrációs ismeretek
  • Alapvető programozási ismeretek
 35 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (3)

Közelgő kurzusok

Rokon kategóriák