Kurzusleírás
Bevezetés a DataStage-be
- Az ETL folyamat áttekintése
- A DataStage architektúra megértése
- A DataStage kulcsfontosságú összetevői
DataStage rendszergazdálás
- Telepítés és konfigurálás
- Felhasználói és biztonsági kezelés
- Projekt beállítása és környezet kezelése
- Feladatütemezés és menedzsment
- Biztonsági mentés és helyreállítási eljárások
Adatkinyerési technikák
- Kapcsolódás különböző adatforrásokhoz
- Adatok kinyerése adatbázisokból, sima fájlokból és külső forrásokból
- Adatkinyerés ajánlott eljárásai
Adatátalakítás a DataStage segítségével
- A DataStage designer megértése
- Különböző szakaszokkal való munka
- Üzleti logika implementálása az átalakításokban
- Haladó adatátalakítási technikák
Adatbetöltés és integráció
- Adatok betöltése a célrendszerekbe
- Adatminőség és integritás biztosítása
- Hibakezelés és naplózás
Teljesítményhangolás és optimalizálás
- Ajánlott eljárások a teljesítményhangoláshoz
- Erőforrás kezelés
- Feladatsorozat és párhuzamos feldolgozás
Haladó témák
- Munka a DataStage directorral
- Hibakeresés és hibaelhárítás
Összefoglalás és következő lépések
Követelmények
- Alapvető ismeretek az adatbázisokról
- Ismeretek az SQL-ben és az adattárházak elveiben
Célközönség
- IT szakemberek
- Adatbázis-rendszergazdák
- Fejlesztők
Vélemények (5)
A élő példák
Ahmet Bolat - Accenture Industrial SS
Kurzus - Python, Spark, and Hadoop for Big Data
Gépi fordítás
nagyon interaktív...
Richard Langford
Kurzus - SMACK Stack for Data Science
Gépi fordítás
Elegendő gyakorlati tanulási lehetőség, a képző tudatosan elismétli a fontos pontokat.
Chris Tan
Kurzus - A Practical Introduction to Stream Processing
Gépi fordítás
Megismerheti a Spark Streaming-et, a Databricks-ot és az AWS Redshiftet.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurzus - Apache Spark in the Cloud
Gépi fordítás
gyakorló feladatok
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurzus - Python and Spark for Big Data (PySpark)
Gépi fordítás