Kurzusleírás

1: HDFS (17%)

  • Leírja az HDFS Daemonok funkcióját
  • Leírja az Apache Hadoop cluster normális működését, az adattárolás és adatfeldolgozás területén
  • Határozza meg az Apache Hadoop-t motiváló számítástechnikai rendszerek jelenlegi funkcióit
  • Osztályozza a HDFS tervezői fő céljait
  • Adva egy helyzet, határozza meg a HDFS Federation megfelelő alkalmazási esetét
  • Határozza meg az HDFS HA-Quorum cluster összetevői és daemonjai
  • Elemezze a HDFS biztonság (Kerberos) szerepét
  • Határozza meg a legjobb adatsorozatosítási választ egy adott helyzethez
  • Leírja a fájl olvasási és írási utakat
  • Határozza meg a parancsokat a fájlok kezeléséhez a Hadoop File System Shell-ben

2: YARN és MapReduce verzió 2 (MRv2) (17%)

  • Értesse meg, hogyan befolyásolja a cluster beállításait a Hadoop 1-ről Hadoop 2-re történő frissítés
  • Értesse meg, hogyan telepítheti a MapReduce v2-t (MRv2 / YARN), beleértve az összes YARN daemonot
  • Értesse meg a MapReduce v2 (MRv2) alapvető tervezői stratégiáját
  • Határozza meg, hogyan kezelik a YARN a erőforrás-allocációt
  • Határozza meg a MapReduce-job folyó YARN-on történő munkafolyamatát
  • Határozza meg, melyik fájlokat kell megváltoztatnia és hogyan, hogy átmigráljon egy cluster-t MapReduce verzió 1-ről (MRv1) MapReduce verzió 2-ra (MRv2) YARN-on futtatva

3: Hadoop Cluster tervezése (16%)

  • Főbb szempontok az Apache Hadoop cluster házigallér és operációs rendszerek kiválasztásában
  • Elemezze az operációs rendszer kiválasztási lehetőségeket
  • Értesse meg a magtulajdonos beállításokat és a lemezcserefeladatok
  • Adva egy helyzet és munkaterhelési minták, határozza meg a hozzá illő hardver konfigurációt
  • Adva egy helyzet, határozza meg a clusternek szükséges ökosztemi komponenseket az SLA teljesítéséhez
  • Cluster méretezése: adva egy helyzet és futtatási gyakoriság, határozza meg a munkaterhelés részleteit, beleértve a CPU-t, memóriát, tárolást, lemez I/O-t
  • Lemezméret és konfiguráció, beleértve JBOD-t versus RAID-t, SAN-okat, virtualizációt, és lemezméret követelményeket egy cluster-ben
  • Hálózati topológiák: értesse meg a hálózati használatot a Hadoop-ban (mind HDFS és MapReduce számára) és javasoljon vagy határozzon meg kulcsszerepeket a hálózati tervezői komponenseknek egy adott helyzetben

4: Hadoop Cluster telepítése és adminisztrálása (25%)

  • Adva egy helyzet, határozza meg, hogyan fogja a cluster kezeli a lemez és gép hibákat
  • Elemezze egy naplókonfigurációs beállításokat és naplókonfigurációs fájlformátumot
  • Értesse meg a Hadoop méretek és cluster egészségmegőrző alapjait
  • Határozza meg a cluster megfigyelő eszközök funkcióját és célját
  • Telepítsen minden ökosztemi komponenst a CDH 5-ben, beleértve (de nem korlátozódva): Impala-t, Flume-t, Oozie-t, Hue-t, Manager-t, Sqoop-t, Hive-t és Pig-et
  • Határozza meg a rendelkezésre álló eszközök funkcióját és célját az Apache Hadoop fájlrendszer kezeléséhez

5: Erőforrás Management (10%)

  • Értesse meg az egyes Hadoop schedulerok összefoglaló tervezői céljait
  • Adva egy helyzet, határozza meg, hogyan osztja fel a FIFO scheduler a cluster erőforrásait
  • Adva egy helyzet, határozza meg, hogyan osztja fel a Fair scheduler a cluster erőforrásait YARN-on
  • Adva egy helyzet, határozza meg, hogyan osztja fel a Capacity scheduler a cluster erőforrásait

6: Megfigyelés és naplózás (15%)

  • Értesse meg a Hadoop méretgyűjtő képességeit
  • Elemezze a NameNode és JobTracker Web UI-kat
  • Értesse meg, hogyan figyeli a cluster daemonokat
  • Határozza meg és figyeli a CPU használatot a master node-okon
  • Leírja, hogyan figyeli a swap és memóriatartalékot az összes node-on
  • Határozza meg, hogyan nézhető meg és kezelhető a Hadoop naplófájljai
  • Interpretezze egy naplófájlt

Követelmények

  • Alap Linux adminisztrációs készségek
  • Alap programozási készségek
 35 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (3)

Közelgő kurzusok

Rokon kategóriák