Kurzusleírás
Adatok előfeldolgozása Data Cleaning Adatintegráció és átalakítás Adatcsökkentés Diszkretizálás és fogalomhierarchia létrehozása
Statisztikai következtetés Valószínűségi eloszlások, Véletlen változók, Központi határérték tétel
MintavételBizalmi intervallumokStatisztikai következtetésHipotézisvizsgálatTöbbváltozós lineáris regresszió SpecifikációRészhalmaz kiválasztása
BecslésÉrvényesítésElőrejelzésOsztályozási módszerek Logisztikus regresszióLineáris diszkriminancia analízisK-legközelebbi szomszédok
Naiv BayesOsztályozási módszerek összehasonlításaNeural Networks Neurális hálózatok illesztéseNeurális hálózatok képzési kérdéseiDöntési fák Regressziós fákOsztályozó fák
Fák versus lineáris modellekZsákolás, Random Forests, Zsákolás fokozásaRandom Forests
FellendítésTámogatja a vektoros gépeket és a rugalmas lemezes Maximális árrés osztályozótTámogatja a vektorosztályozókatTámogatja a vektoros gépeket
2 és több osztályú SVMKapcsolat a logisztikai regresszióvalFőkomponensek elemzéseKlaszterezés K-klaszterezést jelent
K-medoidok klaszterezéseHierarchikus klaszterezésSűrűség alapú klaszterezésModellértékelés és -kiválasztás torzítás, variancia és modell összetettségeA mintán belüli előrejelzési hibaBayesi megközelítés
KeresztellenőrzésBootstrap módszerek