Kurzusleírás
Bevezetés
A Dataiku Data Science Studio (DSS) telepítése és konfigurálása
- A Dataiku DSS rendszerkövetelményei
- Apache Hadoop és Apache Spark integráció beállítása
- Dataiku DSS konfigurálása webes proxykkal
- Migráció más platformokról a Dataiku DSS-re
A Dataiku DSS szolgáltatásainak és architektúrájának áttekintése
- Alapobjektumok és grafikonok a Dataiku DSS alapjai
- Mi a recept a Dataiku DSS-ben?
- A Dataiku DSS által támogatott adatkészletek típusai
Dataiku DSS projekt létrehozása
Adatkészletek meghatározása az adatforrásokhoz való csatlakozáshoz a Dataiku DSS-ben
- Munkavégzés DSS csatlakozókkal és fájlformátumokkal
- Szabványos DSS formátumok kontra Hadoop-specifikus formátumok
- Fájlok feltöltése Dataiku DSS projekthez
A Dataiku DSS szerver fájlrendszerének áttekintése
Felügyelt mappák létrehozása és használata
- Dataiku DSS recept egyesítési mappához
- Helyi és nem helyi felügyelt mappák
Fájlrendszer-adatkészlet létrehozása felügyelt mappatartalom használatával
- Tisztítások végrehajtása DSS-kód recepttel
Metrics Dataset és Internal Stats Dataset használata
A DSS letöltési recept megvalósítása a HTTP-adatkészlethez
SQL Adatkészletek és HDFS adatkészletek áthelyezése DSS használatával
Adatkészletek rendelése a Dataiku DSS-ben
- Írói rendezés vs olvasási idejű rendezés
Adatvizuálok feltárása és előkészítése Dataiku DSS projekthez
A Dataiku sémák, tárolási típusok és jelentések áttekintése
Adattisztítási, -normalizálási és -bővítő szkriptek végrehajtása a Dataiku DSS-ben
A Dataiku DSS diagramok felülete és a vizuális aggregációk típusai használata
A DSS interaktív Statistics funkciójának felhasználása
- Egyváltozós elemzés vs kétváltozós elemzés
- A főkomponens-elemző (PCA) DSS eszköz használata
A Machine Learning áttekintése Dataiku DSS-sel
- Felügyelt ML kontra nem felügyelt ML
- Hivatkozások a DSS ML algoritmusokhoz és szolgáltatások kezeléséhez
- Deep Learning Dataiku DSS-sel
A DSS-adatkészletekből és -receptekből származó folyamat áttekintése
Meglévő adatkészletek átalakítása DSS-ben vizuális receptekkel
Felhasználó által meghatározott kódon alapuló DSS-receptek használata
A kódfeltárás és -kísérletezés optimalizálása DSS-kódos notebookokkal
Fejlett DSS-vizualizációk és egyéni előtér-szolgáltatások írása webalkalmazásokkal
A Dataiku DSS Code Reports funkcióval való munkavégzés
Adatprojektek Element megosztása és a DSS irányítópultjának megismerése
Dataiku DSS projekt tervezése és csomagolása újrafelhasználható alkalmazásként
A Dataiku DSS fejlett módszereinek áttekintése
- Optimalizált adatkészlet-particionálás megvalósítása DSS segítségével
- Konkrét DSS feldolgozási részek végrehajtása Kubernetes konténerekben végzett számításokkal
A Dataiku DSS Collaboration és verzióvezérlésének áttekintése
Automatizálási forgatókönyvek, metrikák és ellenőrzések megvalósítása a DSS projekt teszteléséhez
Projektek telepítése és frissítése a DSS automatizálási csomóponttal és csomagokkal
Valós idejű API-k használata a Dataiku DSS-ben
- További API-k és Rest API-k a DSS-ben
Dataiku DSS idősorok elemzése és Forecasting
Projekt biztosítása Dataiku DSS-ben
- Projektengedélyek és irányítópult-engedélyek kezelése
- Speciális biztonsági beállítások megvalósítása
A Dataiku DSS integrálása a felhővel
Hibaelhárítás
Összefoglalás, és következtetés
Követelmények
- Tapasztalat Python, SQL és R programozási nyelvekkel
- Alapvető ismeretek az adatfeldolgozásról Apache Hadoop és Spark segítségével
- A gépi tanulási fogalmak és adatmodellek megértése
- A statisztikai elemzések és az adattudományi koncepciók háttere
- Adatok megjelenítésében és közlésében szerzett tapasztalat
Közönség
- Mérnökök
- Adattudósok
- Adatelemzők