Kurzusleírás
Bevezetés az Apache Sparkba
- A Spark szerepe a big data feldolgozásban
- A Spark architektúrája és annak összetevői
Az Apache Spark beállítása
- Hardver- és szoftverkövetelmények
- Telepítési eljárások önálló és klaszteres módban
- Konfigurációs ajánlások rendszergazdáknak
Spark klaszterek adminisztrálása
- Klaszterkezelő eszközök és technikák
- Spark alkalmazások és klaszter erőforrások monitorozása
- Biztonsági beállítások és felhasználókezelés
Teljesítményhangolás és optimalizálás
- Erőforrások allokálása és ütemezése
- A Spark hangolása optimális teljesítmény érdekében
- Gyakori szűk keresztmetszetek azonosítása és megoldása
Hibaelhárítás és problémamegoldás
- Gyakori Spark adminisztrációs kihívások
- Diagnosztikai eszközök és technikák a hibaelhárításhoz
- Lépésről lépésre a gyakori problémák megoldása
- Ajánlott eljárások az egészséges Spark környezet fenntartásához
Haladó adminisztrációs témák
- Integráció más big data eszközökkel
- Magas rendelkezésre állás és katasztrófa-helyreállítás biztosítása
- Spark klaszterek frissítése és skálázása
Összefoglalás és következő lépések
Követelmények
- Alapvető ismeretek a hálózati konfigurációról és kezelésről
- Ismeret a Linux operációs rendszerben és a parancssori felületen
- Érdeklődés a elosztott számítási rendszerek és a big data kezelés iránt
Célközönség
- Rendszergazdák
Vélemények (3)
Szerettek, hogy gyakorlati volt. Örültem annak, hogy a teóriai ismereteket gyakorlati példákkal alkalmazhattam.
Aurelia-Adriana - Allianz Services Romania
Kurzus - Python and Spark for Big Data (PySpark)
Gépi fordítás
Az, hogy a legtöbb információt, tananyagot, prezentációt és gyakorlatokat elvitthettük magunkkal, így vissza tudjuk nézni őket, és újból átnézhetjük az elsőre nem teljesen megértettekét vagy javíthatjuk a már készítetteinket.
Raul Mihail Rat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás