Kurzusleírás

spark.mllib: adattípusok, algoritmusok és segédprogramok

    Adattípusok Alapstatisztika összefoglaló statisztika korrelációk rétegzett mintavétel hipotézis tesztelés streaming szignifikancia tesztelés véletlenszerű adatgenerálás
Osztályozási és regressziós lineáris modellek (SVM-ek, logisztikai regresszió, lineáris regresszió)
  • naiv Bayes
  • döntési fák
  • faegyüttesek (Random Forests és színátmenettel növelt fák)
  • izotóniás regresszió
  • Együttműködő szűrés alternáló legkisebb négyzetek (ALS)
  • Klaszterezés k-közép
  • Gauss keverék
  • teljesítmény iterációs klaszterezés (PIC)
  • látens Dirichlet allokáció (LDA)
  • felező k-középeket
  • streaming k-means
  • Dimenziócsökkentés szinguláris érték dekompozíció (SVD)
  • főkomponens-elemzés (PCA)
  • Funkciók kinyerése és átalakítása
  • Gyakori mintabányászat FP-növekedés
  • egyesületi szabályok
  • PrefixSpan
  • Értékelési mérőszámok
  • PMML modell exportálása
  • Optimalizálás (fejlesztői) sztochasztikus gradiens süllyedés
  • korlátozott memóriájú BFGS (L-BFGS)
  • spark.ml: magas szintű API-k ML-folyamatokhoz
  • Áttekintés: becslések, transzformátorok és csővezetékek Jellemzők kinyerése, átalakítása és kiválasztása Osztályozás és regresszió Klaszterezés Haladó témák

    Követelmények

    Az alábbiak egyikének ismerete:

    • Jáva
    • Scala
    • Piton
    • SparkR.
      35 Hours

    Résztvevők száma



    Ár per résztvevő

    Vélemények (8)

    Rokon tanfolyam

    Big Data Analytics in Health

      21 Hours

    Rokon kategóriák