Kurzusleírás

Bevezetés

A Dataiku Data Science Studio (DSS) telepítése és konfigurálása

  • A Dataiku DSS rendszerkövetelményei
  • Apache Hadoop és Apache Spark integráció beállítása
  • Dataiku DSS konfigurálása webes proxykkal
  • Migráció más platformokról a Dataiku DSS-re

A Dataiku DSS szolgáltatásainak és architektúrájának áttekintése

  • Alapobjektumok és grafikonok a Dataiku DSS alapjai
  • Mi a recept a Dataiku DSS-ben?
  • A Dataiku DSS által támogatott adatkészletek típusai

Dataiku DSS projekt létrehozása

Adatkészletek meghatározása az adatforrásokhoz való csatlakozáshoz a Dataiku DSS-ben

  • Munkavégzés DSS csatlakozókkal és fájlformátumokkal
  • Szabványos DSS formátumok kontra Hadoop-specifikus formátumok
  • Fájlok feltöltése Dataiku DSS projekthez

A Dataiku DSS szerver fájlrendszerének áttekintése

Felügyelt mappák létrehozása és használata

  • Dataiku DSS recept egyesítési mappához
  • Helyi és nem helyi felügyelt mappák

Fájlrendszer-adatkészlet létrehozása felügyelt mappatartalom használatával

  • Tisztítások végrehajtása DSS-kód recepttel

Metrics Dataset és Internal Stats Dataset használata

A DSS letöltési recept megvalósítása a HTTP-adatkészlethez

SQL Adatkészletek és HDFS adatkészletek áthelyezése DSS használatával

Adatkészletek rendelése a Dataiku DSS-ben

  • Írói rendezés vs olvasási idejű rendezés

Adatvizuálok feltárása és előkészítése Dataiku DSS projekthez

A Dataiku sémák, tárolási típusok és jelentések áttekintése

Adattisztítási, -normalizálási és -bővítő szkriptek végrehajtása a Dataiku DSS-ben

A Dataiku DSS diagramok felülete és a vizuális aggregációk típusai használata

A DSS interaktív Statistics funkciójának felhasználása

  • Egyváltozós elemzés vs kétváltozós elemzés
  • A főkomponens-elemző (PCA) DSS eszköz használata

A Machine Learning áttekintése Dataiku DSS-sel

  • Felügyelt ML kontra nem felügyelt ML
  • Hivatkozások a DSS ML algoritmusokhoz és szolgáltatások kezeléséhez
  • Deep Learning Dataiku DSS-sel

A DSS-adatkészletekből és -receptekből származó folyamat áttekintése

Meglévő adatkészletek átalakítása DSS-ben vizuális receptekkel

Felhasználó által meghatározott kódon alapuló DSS-receptek használata

A kódfeltárás és -kísérletezés optimalizálása DSS-kódos notebookokkal

Fejlett DSS-vizualizációk és egyéni előtér-szolgáltatások írása webalkalmazásokkal

A Dataiku DSS Code Reports funkcióval való munkavégzés

Adatprojektek Element megosztása és a DSS irányítópultjának megismerése

Dataiku DSS projekt tervezése és csomagolása újrafelhasználható alkalmazásként

A Dataiku DSS fejlett módszereinek áttekintése

  • Optimalizált adatkészlet-particionálás megvalósítása DSS segítségével
  • Konkrét DSS feldolgozási részek végrehajtása Kubernetes konténerekben végzett számításokkal

A Dataiku DSS Collaboration és verzióvezérlésének áttekintése

Automatizálási forgatókönyvek, metrikák és ellenőrzések megvalósítása a DSS projekt teszteléséhez

Projektek telepítése és frissítése a DSS automatizálási csomóponttal és csomagokkal

Valós idejű API-k használata a Dataiku DSS-ben

  • További API-k és Rest API-k a DSS-ben

Dataiku DSS idősorok elemzése és Forecasting

Projekt biztosítása Dataiku DSS-ben

  • Projektengedélyek és irányítópult-engedélyek kezelése
  • Speciális biztonsági beállítások megvalósítása

A Dataiku DSS integrálása a felhővel

Hibaelhárítás

Összefoglalás, és következtetés

Követelmények

  • Tapasztalat Python, SQL és R programozási nyelvekkel
  • Alapvető ismeretek az adatfeldolgozásról Apache Hadoop és Spark segítségével
  • A gépi tanulási fogalmak és adatmodellek megértése
  • A statisztikai elemzések és az adattudományi koncepciók háttere
  • Adatok megjelenítésében és közlésében szerzett tapasztalat

Közönség

  • Mérnökök
  • Adattudósok
  • Adatelemzők
 21 Hours

Résztvevők száma



Ár per résztvevő

Rokon tanfolyam

Rokon kategóriák