Kurzusleírás

gyors áttekintés

  • Adatforrások
  • Minding Data
  • Ajánló rendszerek
  • Cél Marketing

Adattípusok

  • Strukturált vs strukturálatlan
  • Statikus vs streamelt
  • Attitűdbeli, viselkedési és demográfiai adatok
  • Adatvezérelt vs felhasználóvezérelt elemzés
  • adatok érvényessége
  • Az adatok mennyisége, sebessége és változatossága

Modellek

  • Modellek építése
  • Statisztikai modellek
  • Gépi tanulás

Adatok osztályozása

  • Klaszterezés
  • kCsoportok, k-középek, a legközelebbi szomszédok
  • Hangyatelepek, madarak sereglenek

Prediktív modellek

  • Döntési fák
  • Támogatja a vektoros gépet
  • Naiv Bayes besorolás
  • Neurális hálózatok
  • Markov modell
  • Regresszió
  • Együttes módszerek

ROI

  • Haszon/költség arány
  • Szoftver költsége
  • A fejlesztés költsége
  • Lehetséges előnyök

Építési modellek

  • Adat-előkészítés (MapReduce)
  • Adattisztítás
  • A módszerek kiválasztása
  • Fejlesztő modell
  • Tesztelési modell
  • Modellértékelés
  • Modell bevezetés és integráció

A nyílt forráskódú és kereskedelmi szoftverek áttekintése

  • R-projekt csomag kiválasztása
  • Python könyvtárak
  • Hadoop és Mahout
  • A Big Data-hoz és az Analytics szolgáltatáshoz kapcsolódó kiválasztott Apache-projektek
  • Válogatott kereskedelmi megoldás
  • Integráció meglévő szoftverekkel és adatforrásokkal

Követelmények

Hagyományos adatkezelési és elemzési módszerek megértése, mint SQL, adattárházak, üzleti intelligencia, OLAP, stb... Az alapvető statisztikák és valószínűségek (átlag, szórás, valószínűség, feltételes valószínűség stb.) megértése...

  21 Hours

Résztvevők száma



Ár per résztvevő

Vélemények (2)

Rokon tanfolyam

Unified Batch and Stream Processing with Apache Beam

  14 Hours

Rokon kategóriák