Kurzusleírás
Bevezetés a Google Colab és Apache Spark használatába
- A Google Colab áttekintése
- Bevezetés az Apache Spark használatába
- Spark beállítása a Google Colab-ban
Adatfeldolgozás Apache Spark segítségével
- Munka RDD-kkel és DataFrame-ekkel
- Nagy adathalmazok betöltése és feldolgozása
- Strukturált adatok lekérdezése Spark SQL segítségével
Speciális elemzések Spark segítségével
- Gépi tanulás a Spark MLlib segítségével
- Valós idejű adatelemzés végrehajtása
- Elosztott számítások Spark segítségével
Vizualizáció és együttműködés a Google Colab-ban
- Colab integrálása népszerű vizualizációs könyvtárakkal
- Együttműködő munkafolyamatok Colab notebookokkal
- Eredmények megosztása és exportálása
Big Data munkafolyamatok optimalizálása
- Spark finomhangolása a teljesítmény érdekében
- Memória- és tárolóhasználat optimalizálása
- Munkafolyamatok skálázása nagy adathalmazokhoz
Big Data a felhőben
- Google Colab integrálása felhőalapú eszközökkel
- Felhőalapú tároló használata nagy adatokhoz
- Spark használata elosztott felhőkörnyezetekben
Esettanulmányok és ajánlott eljárások
- Valós világi Big Data alkalmazások áttekintése
- Esettanulmányok Apache Spark és Colab használatával
- Ajánlott eljárások a Big Data elemzéshez
Összefoglalás és következő lépések
Követelmények
- Alapvető ismeretek az adattudomány alapjairól
- Ismeretek az Apache Spark használatáról
- Python programozási ismeretek
Célközönség
- Adattudósok
- Adatmérnökök
- Nagy adatokkal dolgozó kutatók
Vélemények (2)
Végzett gyakorlat
Joe Pang - Lands Department, Hong Kong
Kurzus - QGIS for Geographic Information System
Gépi fordítás
A gyakorlati példák lehetővé tették, hogy valódi tapasztalatot szerezhessünk a program működésével kapcsolatban. Jó magyarázatok és elméleti fogalmak integrálása, valamint ezek praktikus alkalmazásai közötti összefüggések kifejezetten hasznosak voltak.
Ian - Archeoworks Inc.
Kurzus - ArcGIS Fundamentals
Gépi fordítás