Kurzusleírás
Bevezetés
- Bevezetés a felhőalapú számítástechnikába és a Big Data megoldásokba
- Az Apache Hadoop funkcióinak és architektúrájának áttekintése
Hadoop beállítása
- Hadoop klaszter tervezése (helyszíni, felhő, stb.)
- Az operációs rendszer és a Hadoop disztribúció kiválasztása
- Erőforrások kiépítése (hardver, hálózat, stb.)
- A szoftver letöltése és telepítése
- A klaszter méretezése rugalmasság érdekében
Munka a HDFS-sel
- A Hadoop Distributed File System (HDFS) megértése
- A HDFS parancsreferencia áttekintése
- HDFS elérése
- Alapfokú fájlműveletek végrehajtása a HDFS-en
- Az S3 használata a HDFS kiegészítéseként
A MapReduce áttekintése
- Az adatáramlás megértése a MapReduce keretrendszerben
- Map, Shuffle, Sort és Reduce
- Bemutató: Legmagasabb fizetések kiszámítása
Munka a YARN-nel
- Az erőforrás-kezelés megértése a Hadoopban
- Munka a ResourceManagerrel, NodeManagerrel, Application Masterrel
- Feladatok ütemezése a YARN alatt
- Ütemezés nagy számú csomópont és klaszter esetén
- Bemutató: Feladatütemezés
Hadoop integrálása a Sparkkal
- Tároló beállítása a Sparkhoz (HDFS, Amazon, S3, NoSQL, stb.)
- A Resilient Distributed Datasets (RDD-k) megértése
- RDD létrehozása
- RDD transzformációk implementálása
- Bemutató: Szöveges keresőprogram implementálása filmcímekhez
Hadoop klaszter kezelése
- Hadoop monitorozása
- Hadoop klaszter biztonságba helyezése
- Csomópontok hozzáadása és eltávolítása
- Teljesítményteszt futtatása
- Hadoop klaszter hangolása a teljesítmény optimalizálása érdekében
- Biztonsági mentés, helyreállítás és üzletmenet-folytonossági tervezés
- Magas rendelkezésre állás (HA) biztosítása
Hadoop klaszter frissítése és migrálása
- Terhelési követelmények felmérése
- Hadoop frissítése
- Átállás helyszínről felhőbe és fordítva
- Hibákból való helyreállítás
Hibaelhárítás
Összefoglalás és befejezés
Követelmények
- Rendszergazdai tapasztalat
- Tapasztalat Linux parancssorral
- A big data fogalmak ismerete
Közönség
- Rendszergazdák
- Adatbázis-rendszergazdák
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Elegendő gyakorlati tanulási lehetőség, a képző tudatosan elismétli a fontos pontokat.
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Gépi fordítás
Megismerheti a Spark Streaming-et, a Databricks-ot és az AWS Redshiftet.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurzus - Apache Spark in the Cloud
Gépi fordítás
gyakorlati dolgokat is elvégezhetett, sőt Ajay jóképpen elméletet is tartott
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurzus - Hadoop Administration on MapR
Gépi fordítás