Kurzusleírás

Big Data áttekintés:

  • Mi az Big Data?
  • Miért terjed el Big Data népszerűsége
  • Big Data esettanulmányok
  • Big Data jellemzői
  • Megoldások Big Data használatához.

Hadoop és komponensei:

  • Mi az Hadoop és milyen komponensei?
  • Hadoop architektúra és az adatkezelési/folyamatkezelési jellemzői
  • Hadoop története, használó cégek és miért kezdték el használni
  • Hadoop keretrendszer és komponensei – részletes leírás
  • Mi az HDFS és az olvasási-írási műveletek Hadoop elosztott fájlrendszerében.
  • Hogyan állítsuk be Hadoop cluster-t különböző módokon – Stand-alone/Pseudo/Multi Node cluster.

(Ez belepártozik a Hadoop cluster beállításába VirtualBox/KVM/VMware -ban, a hálózati konfigurációk pontos vizsgálatába, a Hadoop daemons futtatásába és a cluster tesztelésébe.)

  • Mi a Map Reduce keretrendszer és hogyan működik.
  • Map Reduce feladatok futtatása Hadoop cluster-en.
  • Replikáció, tükrözés és rack tudatosság érthetőbben Hadoop cluster-ek kontextusában.

Hadoop cluster tervezése:

  • Hogyan tervezzük meg a hadoop cluster-ünket.
  • A hardver- és szoftverismeret megértése a hadoop cluster tervezéséhez.
  • A munkaterhelések megértése és a cluster tervezése a hibák elkerülése és a legjobb teljesítmény érdekében.

Mi a MapR és miért a MapR:

  • MapR áttekintése és architektúrája.
  • MapR vezérlő rendszer, MapR volumenek, snapshots és tükrözők működése.
  • Cluster tervezése a MapR kontextusában.
  • MapR összehasonlítása más disztribúciókkal és Apache Hadoop -al.
  • MapR telepítése és cluster telepítése.

Cluster beállítása és kezelése:

  • Szolgáltatások, csomópontok, snapshots, tükrözött volumenek és távoli clusterek kezelése.
  • Csomópontok megértése és kezelése.
  • Hadoop komponenseinek megértése, Hadoop komponensek telepítése MapR szolgáltatások mellett.
  • Adatok Access -zése a cluster-ben, beleértve az NFS használatát, szolgáltatások és csomópontok kezelése.
  • Adatok kezelése volumenek használatával, felhasználók és csoportok kezelése, szerepek hozzárendelése csomópontokhoz, csomópontok aktiválása és letiltása, cluster adminisztráció és teljesítményfigyelés, metrikák beállítása/analízise és figyelése a teljesítmény érdekében, MapR biztonsági beállításainak és adminisztrálásának konfigurálása.
  • M7 – MapR táblák számára native tároló megértése és használata.
  • Cluster konfigurálása és optimalizálása a legjobb teljesítmény érdekében.

Cluster frissítése és integráció más beállításokkal:

  • MapR szoftver verziójának frissítése és a frissítés típusai.
  • MapR cluster beállítása HDFS clusterhez való hozzáféréshez.
  • MapR cluster beállítása Amazon Elastic Mapreduce-on.

Mind fentebb említett témák tartalmaznak demonstrációkat és gyakorlati órákat, hogy a tanulóknak kézbe vehető tapasztalata legyen a technológiával.

Követelmények

  • Alapvető ismeretek az Linux FS-ről
  • Alapvető Java
  • Apache Hadoop ismerete (ajánlott)
 28 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (1)

Közelgő kurzusok

Rokon kategóriák