Kurzusleírás

gyors áttekintés

  • Adatforrások
  • Minding Data
  • Ajánló rendszerek
  • Cél Marketing

Adattípusok

  • Strukturált vs strukturálatlan
  • Statikus vs streamelt
  • Attitűdbeli, viselkedési és demográfiai adatok
  • Adatvezérelt vs felhasználóvezérelt elemzés
  • adatok érvényessége
  • Az adatok mennyisége, sebessége és változatossága

Modellek

  • Modellek építése
  • Statisztikai modellek
  • Gépi tanulás

Adatok osztályozása

  • Klaszterezés
  • kCsoportok, k-középek, a legközelebbi szomszédok
  • Hangyatelepek, madarak sereglenek

Prediktív modellek

  • Döntési fák
  • Támogatja a vektoros gépet
  • Naiv Bayes besorolás
  • Neurális hálózatok
  • Markov modell
  • Regresszió
  • Együttes módszerek

ROI

  • Haszon/költség arány
  • Szoftver költsége
  • A fejlesztés költsége
  • Lehetséges előnyök

Építési modellek

  • Adat-előkészítés (MapReduce)
  • Adattisztítás
  • A módszerek kiválasztása
  • Fejlesztő modell
  • Tesztelési modell
  • Modellértékelés
  • Modell bevezetés és integráció

A nyílt forráskódú és kereskedelmi szoftverek áttekintése

  • R-projekt csomag kiválasztása
  • Python könyvtárak
  • Hadoop és Mahout
  • A Big Data-hoz és az Analytics szolgáltatáshoz kapcsolódó kiválasztott Apache-projektek
  • Válogatott kereskedelmi megoldás
  • Integráció meglévő szoftverekkel és adatforrásokkal

Követelmények

Hagyományos adatkezelési és elemzési módszerek megértése, mint SQL, adattárházak, üzleti intelligencia, OLAP, stb... Az alapvető statisztikák és valószínűségek (átlag, szórás, valószínűség, feltételes valószínűség stb.) megértése...

  21 Hours
 

Résztvevők száma


Tanfolyam kezdete

Tanfolyam vége


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Vélemények (2)

Rokon tanfolyam

Unified Batch and Stream Processing with Apache Beam

  14 Hours

Rokon kategóriák