Kurzusleírás
Bevezetés
- Bevezetés a Cloud Computing és Big Data megoldásokba
- Az Apache Hadoop szolgáltatásainak és architektúrájának áttekintése
Beállítás Hadoop
- Hadoop fürt tervezése (helyi, felhő stb.)
- Az operációs rendszer és a Hadoop disztribúció kiválasztása
- Erőforrások biztosítása (hardver, hálózat stb.)
- A szoftver letöltése és telepítése
- A fürt méretezése a rugalmasság érdekében
HDFS-szel dolgozni
- Az Hadoop elosztott fájlrendszer (HDFS) megértése
- A HDFS parancsreferencia áttekintése
- AccessHDFS használata
- Alapvető fájlműveletek végrehajtása HDFS-en
- Az S3 használata a HDFS kiegészítéseként
A MapReduce áttekintése
- Az adatáramlás megértése a MapReduce keretrendszerben
- Térkép, keverés, rendezés és kicsinyítés
- Demo: A legjobb fizetések számítása
Dolgozunk FONAL-lal
- Az erőforrás-kezelés megértése itt: Hadoop
- Munkavégzés ResourceManager, NodeManager, Application Master programokkal
- Munkák ütemezése a YARN alatt
- Ütemezés nagyszámú csomóponthoz és fürthöz
- Demo: Munkaütemezés
Integrálás Hadoop a Sparkba
- Tárhely beállítása a Spark számára (HDFS, Amazon, S3, NoSQL stb.)
- A rugalmas elosztott adatkészletek (RDD) megértése
- RDD létrehozása
- RDD átalakítások megvalósítása
- Demo: Szöveges Search program megvalósítása filmcímekhez
Hadoop Klaszter kezelése
- Monitoring Hadoop
- Egy Hadoop fürt biztosítása
- Csomópontok hozzáadása és eltávolítása
- Teljesítmény-benchmark futtatása
- A Hadoop fürt hangolása a teljesítmény optimalizálására
- Biztonsági mentés, helyreállítás és üzletmenet-folytonosság tervezése
- Magas rendelkezésre állás biztosítása (HA)
Hadoop fürt frissítése és áttelepítése
- A munkaterhelési követelmények felmérése
- Frissítés Hadoop
- Helyszínről a felhőre és fordítva
- Felépülés a kudarcokból
Hibaelhárítás
Összefoglalás, és következtetés
Követelmények
- Rendszergazdai tapasztalat
- Tapasztalat a Linux parancssor használatában
- A big data fogalmak megértése
Közönség
- Rendszergazdák
- DBA-k
Vélemények (5)
Sok gyakorlati példa, különböző módok ugyanannak a problémának a megközelítésére, és néha nem túl nyilvánvaló trükkök a jelenlegi megoldás javítására
Rafal - Nordea
Kurzus - Apache Spark MLlib
Gépi fordítás
very interactive...
Richard Langford
Kurzus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurzus - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift