Kurzusleírás
Adatrakodó alapok
- A rakodó célja, komponensei és architektúrája
- Adatmartok, vállalati rakodók és tóház minták
- OLTP vs OLAP alapelvek és munkaterhelés elválasztása
Dimenziális modellkészítés
- Tények, dimenziók és szemcseméret
- Csillag séma vs hópehely séma
- Lassúan változó dimenziók típusai és kezelése
ETL és ELT folyamatok
- Adatkivonási stratégiák OLTP-rendszerekből és API-kból
- Átalakítások, adat tisztítás és megfelelőség
- Betöltési minták, koordinálás és függőségek kezelése
Adatminőség és metadatok kezelése
- Adatprofilozás és érvényesítési szabályok
- Mester- és referenciadatok egyeztetése
- Származás, katalogusok és dokumentáció
Analitika és teljesítmény
- Kockázatfogalomok, aggregálások és materializált nézetek
- Részre osztás, csoportosítás és indexelés az analitikához
- Munkaterheléskezelés, gyorsítótár és lekérdezés finomítása
Biztonság és kormányzás
- Hozzáférési ellenőrzés, szerepek és sor szintű biztonság
- Egyeztetési szempontok és ellenőrzés
- Biztonsági mentés, visszaállítás és megbízhatóság gyakorlatok
Modern architektúrák
- Felhő adatrakodók és rugalmasság
- Streaming beolvasás és közel valós idejű analitika
- Költségoptimalizálás és monitorozás
Összefoglaló: Forrásból csillag séma
- Üzleti folyamat modellzése tényekbe és dimenziókba
- Teljes ETL vagy ELT munkafolyamat létrehozása
- Panelok publikálása és mutatók ellenőrzése
Összegzés és következő lépések
Követelmények
- Relációs adatbázisok és SQL ismerete
- Adatanalízis vagy jelentéskészítés tapasztalata
- Alapvető ismeretek a felhő vagy helyi adattároló platformokkal kapcsolatban
Célközönség
- Adatanalitikusok, akik átállnak az adatáramlatra
- BI fejlesztők és ETL mérnökök
- Adatarchitektusok és csapatvezetők
Vélemények (5)
Az élők példái
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Elég gyakorlati tapasztalatra van lehetőség, a tanár szakértelemmel rendelkezik
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Gépi fordítás
Ismerkedj el a Spark Streaming, Databricks és AWS Redshift technológiákkal
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurzus - Apache Spark in the Cloud
Gépi fordítás
gyakorló feladatok
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurzus - Python and Spark for Big Data (PySpark)
Gépi fordítás