Kurzusleírás
Bevezetés
- Bevezetés a felhőszámításba és a nagy adatok megoldásaiba
- Az Apache Hadoop jellemzőinek és architektúrájának áttekintése
Hadoop beállítása
- Egy Hadoop fürt tervezése (helyszíni, felhőben stb.)
- Működési rendszer és Hadoop verzió kiválasztása
- Irodalmak biztosítása (hardver, hálózat stb.)
- A szoftver letöltése és telepítése
- Fürt méretének rugalmas beállítása
Munka az HDFS-vel
- Az Hadoop Distributed File System (HDFS) megértése
- Az HDFS parancsok áttekintése
- HDFS elérése
- Alapvető fájlmuveletek végrehajtása az HDFS-en
- Az S3 használata az HDFS kiegészítőjeként
A MapReduce áttekintése
- A MapReduce keretrendszerben történő adatáramlás megértése
- Map, Shuffle, Sort és Reduce folyamatok
- Mutató: Felső díjak számítása
Munka a YARN-nal
- A Hadoop erőforráskezelésének megértése
- Az ResourceManager, NodeManager és Application Master használata
- Feladatok ütemezése a YARN-al
- Nagyméretű fürtök és csomópontok ütemezése
- Mutató: Feladatok ütemezése
Hadoop integrálása a Spark-kal
- Adattárolás beállítása a Spark számára (HDFS, Amazon S3, NoSQL stb.)
- A Resilient Distributed Datasets (RDDs) megértése
- Egy RDD létrehozása
- Transformációk végrehajtása az RDD-n
- Mutató: Filmcímek szöveges keresési programjának megvalósítása
Egy Hadoop fürt kezelése
- A Hadoop monitorozása
- Egy Hadoop fürt biztonságossá tételének módja
- Csomópontok hozzáadása és eltávolítása
- Egy teljesítménybenchmark futtatása
- A Hadoop fürt finomhangolása a teljesítmény optimalizálása érdekében
- Biztonsági mentés, helyreállítás és üzletmenet folyamatos biztosítása
- Magas rendelkezésre állás (HA) biztosítása
Egy Hadoop fürt frissítése és áthelyezése
- Munkaterhelés követelmények becslése
- A Hadoop frissítése
- Helyszíni környezetből felhőbe, illetve fordítva való áthelyezés
- Hibák utáni helyreállítás
Hibaelhárítás
Összegzés és következtetés
Követelmények
- Rendszergazdai tapasztalat
- Tapasztalat Linux parancssori eszközeivel
- Nagy adatok fogalmak megértése
Célcsoport
- Rendszergazdák
- Adatbázis-kezelők (DBAs)
Vélemények (5)
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Elég gyakorlati tapasztalatra van lehetőség, a tanár szakértelemmel rendelkezik
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Gépi fordítás
Ismerkedj el a Spark Streaming, Databricks és AWS Redshift technológiákkal
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurzus - Apache Spark in the Cloud
Gépi fordítás
gyakorló feladatok
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurzus - Python and Spark for Big Data (PySpark)
Gépi fordítás