Kurzusleírás

Big Data Áttekintés:

  • Mi a Big Data
  • Miért vált népszerűvé a Big Data
  • Big Data esettanulmányok
  • Big Data jellemzői
  • Megoldások a Big Data kezelésére.

Hadoop és annak összetevői:

  • Mi a Hadoop és mik az összetevői.
  • Hadoop architektúra és az általa kezelt/feldolgozott adatok jellemzői.
  • Rövid áttekintés a Hadoop történetéről, a használó cégekről és azok indíttatásairól.
  • Hadoop keretrendszer és annak összetevői – részletes magyarázat.
  • Mi a HDFS és a Hadoop elosztott fájlrendszerbe való írás-olvasás.
  • Hadoop klaszter beállítása különböző módokban – Önálló/Pszeudo/Többcsomópontos klaszter.

(Ez magában foglalja a Hadoop klaszter beállítását VirtualBox/KVM/VMware környezetben, a figyelmet igénylő hálózati konfigurációkat, a Hadoop démonok futtatását és a klaszter tesztelését).

  • Mi a MapReduce keretrendszer és hogyan működik.
  • MapReduce feladatok futtatása Hadoop klaszteren.
  • Replikáció, tükrözés és rack-aware ismeretek a Hadoop klaszterek kontextusában.

Hadoop Klaszter Tervezés:

  • Hogyan tervezzük meg a Hadoop klasztert.
  • Hardver-szoftver ismeretek a Hadoop klaszter tervezéséhez.
  • Munkaterhelések megértése és a klaszter tervezése a hibák elkerülése és optimális teljesítmény érdekében.

Mi a MapR és miért a MapR:

  • A MapR áttekintése és architektúrája.
  • A MapR Control System, MapR kötetek, pillanatképek és tükrök működésének megértése.
  • Klaszter tervezése a MapR kontextusában.
  • A MapR összehasonlítása más disztribúciókkal és az Apache Hadoop-val.
  • MapR telepítése és klaszter üzembe helyezése.

Klaszter Beállítás és Adminisztráció:

  • Szolgáltatások, csomópontok, pillanatképek, tükröző kötetek és távoli klaszterek kezelése.
  • Csomópontok megértése és kezelése.
  • Hadoop összetevők megértése, Hadoop összetevők telepítése a MapR szolgáltatások mellett.
  • Adatok elérése a klaszteren, beleértve az NFS-en keresztüli elérést. Szolgáltatások és csomópontok kezelése.
  • Adatok kezelése kötetek használatával, felhasználók és csoportok kezelése, szerepkörök hozzárendelése a csomópontokhoz, csomópontok aktiválása és deaktiválása, klaszter adminisztráció és teljesítményfigyelés, metrikák konfigurálása/elemzése és monitorozása a teljesítmény követéséhez, MapR biztonság beállítása és adminisztrálása.
  • Az M7 – natív tároló a MapR táblákhoz – megértése és használata.
  • Klaszter konfiguráció és finomhangolás optimális teljesítmény érdekében.

Klaszter Frissítés és Integráció Más Rendszerekkel:

  • A MapR szoftver verziójának frissítése és a frissítés típusai.
  • MapR klaszter konfigurálása HDFS klaszter eléréséhez.
  • MapR klaszter beállítása az Amazon Elastic Mapreduce-on.

Az összes fenti témakör tartalmaz bemutatókat és gyakorlati órákat, hogy a tanulók kézzelfogható tapasztalatot szerezzenek a technológiával.

Követelmények

  • Alapvető ismeretek a Linux fájlrendszerről
  • Alapvető Java ismeretek
  • Apache Hadoop ismerete (ajánlott)
 28 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák