Kurzusleírás
Bevezetés a Apache Spark-ba
- A Spark szerepe a nagy adatfeldolgozásban
- Spark architektúra és összetevői
Beállítás Apache Spark
- Hardver és szoftver követelmények
- Telepítési eljárások önálló és fürt módokhoz
- Bevált konfigurálási gyakorlatok rendszergazdák számára
Spark-fürtök adminisztrálása
- Klaszterkezelési eszközök és technikák
- A Spark alkalmazások és fürt erőforrások figyelése
- Biztonsági konfigurációk és felhasználókezelés
Teljesítmény hangolás és optimalizálás
- Erőforrások elosztása és ütemezése
- Tuning Spark az optimális teljesítmény érdekében
- A gyakori szűk keresztmetszetek azonosítása és feloldása
Hibaelhárítás és problémamegoldás
- Gyakori Spark-adminisztrációs kihívások
- Diagnosztikai eszközök és technikák a hibaelhárításhoz
- Lépésről lépésre a gyakori problémák megoldásához
- A legjobb gyakorlatok az egészséges Spark-környezet fenntartásához
Haladó adminisztrációs témák
- Integráció más big data eszközökkel
- Magas rendelkezésre állás és katasztrófa utáni helyreállítás biztosítása
- A Spark-fürtök frissítése és méretezése
Összegzés és a következő lépések
Követelmények
- Hálózati konfiguráció és menedzsment alapismeretei
- A Linux operációs rendszer és a parancssori felület ismerete
- Érdekel az elosztott számítástechnikai rendszerek és a big data kezelésének ismerete
Közönség
- Rendszergazdák
Vélemények (5)
Sok gyakorlati példa, különböző módok ugyanannak a problémának a megközelítésére, és néha nem túl nyilvánvaló trükkök a jelenlegi megoldás javítására
Rafal - Nordea
Kurzus - Apache Spark MLlib
Gépi fordítás
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurzus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift