Kurzusleírás

Első nap: A nyelv alapjai

  • Kurzus bemutatása
  • Az adattudományról
    • Az adattudomány definíciója
    • Az adattudomány folyamata
  • Az R nyelv bemutatása
  • Változók és típusok
  • Vezérlési szerkezetek (ciklusok / feltételek)
  • R skalárok, vektorok és mátrixok
    • R vektorok definiálása
    • Mátrixok
  • Szövegkezelés
    • Karakter adattípus
    • Fájl beolvasás és írás
  • Listák
  • Függvények
    • Függvények bemutatása
    • Zárványok
    • lapply/sapply függvények
  • DataFrames
  • Gyakorlati feladatok minden szekcióhoz

Második nap: Középszintű R programozás

  • DataFrames és fájl beolvasás/írás
  • Adatok beolvasása fájlból
  • Adatok előkészítése
  • Beépített adathalmazok
  • Vizualizáció
    • Graphics csomag
    • plot() / barplot() / hist() / boxplot() / szórásdiagram
    • Hőtérkép
    • ggplot2 csomag (qplot(), ggplot())
  • Feltárás Dplyr-rel
  • Gyakorlati feladatok minden szekcióhoz

Harmadik nap: Haladó R programozás

  • Statisztikai modellezés R-ben
    • Statisztikai függvények
    • Kezelés hiányzó adatokkal (NA)
    • Eloszlások (Binomiális, Poisson, Normál)
  • Regresszió
    • Lineáris regresszió bemutatása
  • Ajánlások
  • Szövegfeldolgozás (tm csomag / Wordclouds)
  • Csoportosítás
    • Bevezetés a csoportosításba
    • KMeans
  • Osztályozás
    • Bevezetés az osztályozásba
    • Naiv Bayes
    • Döntési fák
    • Tanítás a caret csomaggal
    • Algoritmusok kiértékelése
  • R és Big Data
    • R csatlakoztatása adatbázisokhoz
    • Big Data ökoszisztéma
  • Gyakorlati feladatok minden szekcióhoz

Követelmények

  • Alapvető programozási ismeretek előnyben részesítettek

Felszerelés

  • Modern laptop
  • Legfrissebb R Studio és R környezet telepítve
 21 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (7)

Közelgő kurzusok

Rokon kategóriák