Kurzusleírás

Bevezetés

  • Bevezetés a felhőszámításba és a nagy adatok megoldásaiba
  • Az Apache Hadoop jellemzőinek és architektúrájának áttekintése

Hadoop beállítása

  • Egy Hadoop fürt tervezése (helyszíni, felhőben stb.)
  • Működési rendszer és Hadoop verzió kiválasztása
  • Irodalmak biztosítása (hardver, hálózat stb.)
  • A szoftver letöltése és telepítése
  • Fürt méretének rugalmas beállítása

Munka az HDFS-vel

  • Az Hadoop Distributed File System (HDFS) megértése
  • Az HDFS parancsok áttekintése
  • HDFS elérése
  • Alapvető fájlmuveletek végrehajtása az HDFS-en
  • Az S3 használata az HDFS kiegészítőjeként

A MapReduce áttekintése

  • A MapReduce keretrendszerben történő adatáramlás megértése
  • Map, Shuffle, Sort és Reduce folyamatok
  • Mutató: Felső díjak számítása

Munka a YARN-nal

  • A Hadoop erőforráskezelésének megértése
  • Az ResourceManager, NodeManager és Application Master használata
  • Feladatok ütemezése a YARN-al
  • Nagyméretű fürtök és csomópontok ütemezése
  • Mutató: Feladatok ütemezése

Hadoop integrálása a Spark-kal

  • Adattárolás beállítása a Spark számára (HDFS, Amazon S3, NoSQL stb.)
  • A Resilient Distributed Datasets (RDDs) megértése
  • Egy RDD létrehozása
  • Transformációk végrehajtása az RDD-n
  • Mutató: Filmcímek szöveges keresési programjának megvalósítása

Egy Hadoop fürt kezelése

  • A Hadoop monitorozása
  • Egy Hadoop fürt biztonságossá tételének módja
  • Csomópontok hozzáadása és eltávolítása
  • Egy teljesítménybenchmark futtatása
  • A Hadoop fürt finomhangolása a teljesítmény optimalizálása érdekében
  • Biztonsági mentés, helyreállítás és üzletmenet folyamatos biztosítása
  • Magas rendelkezésre állás (HA) biztosítása

Egy Hadoop fürt frissítése és áthelyezése

  • Munkaterhelés követelmények becslése
  • A Hadoop frissítése
  • Helyszíni környezetből felhőbe, illetve fordítva való áthelyezés
  • Hibák utáni helyreállítás

Hibaelhárítás

Összegzés és következtetés

Követelmények

  • Rendszergazdai tapasztalat
  • Tapasztalat Linux parancssori eszközeivel
  • Nagy adatok fogalmak megértése

Célcsoport

  • Rendszergazdák
  • Adatbázis-kezelők (DBAs)
 35 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák