Kurzusleírás

Gyors áttekintés

  • Adatforrások
  • Adatfeldolgozás
  • Ajánlórendszerek
  • Célzott marketing

Adattípusok

  • Strukturált vs. strukturálatlan
  • Statikus vs. streamek
  • Attitudinális, viselkedési és demográfiai adatok
  • Adatvezérelt vs. felhasználóvezérelt elemzések
  • Adatérvényesség
  • Adatok mennyisége, sebessége és változatossága

Modellek

  • Modellek építése
  • Statisztikai modellek
  • Gépi tanulás

Adatbesorolás

  • Csoportosítás
  • k-csoportok, k-közép, legközelebbi szomszédok
  • Hangyák kolóniái, madarak rajzása

Prediktív modellek

  • Döntési fák
  • Támogató vektorgépek
  • Naiv Bayes besorolás
  • Neurális hálózatok
  • Markov-modell
  • Regresszió
  • Együttes módszerek

ROI

  • Haszon/költség arány
  • Szoftver költsége
  • Fejlesztési költség
  • Lehetséges hasznok

Modellek építése

  • Adatelőkészítés (MapReduce)
  • Adattisztítás
  • Módszerek kiválasztása
  • Modell fejlesztése
  • Modell tesztelése
  • Modell értékelése
  • Modell üzembe helyezése és integrálása

Nyílt forráskódú és kereskedelmi szoftverek áttekintése

  • R-project csomagok kiválasztása
  • Python könyvtárak
  • Hadoop és Mahout
  • Kiválasztott Apache projektek a Big Data és az elemzések területén
  • Kiválasztott kereskedelmi megoldások
  • Integráció meglévő szoftverekkel és adatforrásokkal

Követelmények

A hagyományos adatkezelési és elemzési módszerek ismerete, mint például SQL, adatraktárak, üzleti intelligencia, OLAP stb. Az alapvető statisztika és valószínűségszámítás ismerete (átlag, szórás, valószínűség, feltételes valószínűség stb.).

 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (2)

Közelgő kurzusok

Rokon kategóriák