Kurzusleírás

Bevezetés

  • Bevezetés a felhőalapú számítástechnikába és a Big Data megoldásokba
  • Az Apache Hadoop funkcióinak és architektúrájának áttekintése

Hadoop beállítása

  • Hadoop klaszter tervezése (helyszíni, felhő, stb.)
  • Az operációs rendszer és a Hadoop disztribúció kiválasztása
  • Erőforrások kiépítése (hardver, hálózat, stb.)
  • A szoftver letöltése és telepítése
  • A klaszter méretezése rugalmasság érdekében

Munka a HDFS-sel

  • A Hadoop Distributed File System (HDFS) megértése
  • A HDFS parancsreferencia áttekintése
  • HDFS elérése
  • Alapfokú fájlműveletek végrehajtása a HDFS-en
  • Az S3 használata a HDFS kiegészítéseként

A MapReduce áttekintése

  • Az adatáramlás megértése a MapReduce keretrendszerben
  • Map, Shuffle, Sort és Reduce
  • Bemutató: Legmagasabb fizetések kiszámítása

Munka a YARN-nel

  • Az erőforrás-kezelés megértése a Hadoopban
  • Munka a ResourceManagerrel, NodeManagerrel, Application Masterrel
  • Feladatok ütemezése a YARN alatt
  • Ütemezés nagy számú csomópont és klaszter esetén
  • Bemutató: Feladatütemezés

Hadoop integrálása a Sparkkal

  • Tároló beállítása a Sparkhoz (HDFS, Amazon, S3, NoSQL, stb.)
  • A Resilient Distributed Datasets (RDD-k) megértése
  • RDD létrehozása
  • RDD transzformációk implementálása
  • Bemutató: Szöveges keresőprogram implementálása filmcímekhez

Hadoop klaszter kezelése

  • Hadoop monitorozása
  • Hadoop klaszter biztonságba helyezése
  • Csomópontok hozzáadása és eltávolítása
  • Teljesítményteszt futtatása
  • Hadoop klaszter hangolása a teljesítmény optimalizálása érdekében
  • Biztonsági mentés, helyreállítás és üzletmenet-folytonossági tervezés
  • Magas rendelkezésre állás (HA) biztosítása

Hadoop klaszter frissítése és migrálása

  • Terhelési követelmények felmérése
  • Hadoop frissítése
  • Átállás helyszínről felhőbe és fordítva
  • Hibákból való helyreállítás

Hibaelhárítás

Összefoglalás és befejezés

Követelmények

  • Rendszergazdai tapasztalat
  • Tapasztalat Linux parancssorral
  • A big data fogalmak ismerete

Közönség

  • Rendszergazdák
  • Adatbázis-rendszergazdák
 35 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák