Kurzusleírás

I. Bevezetés és előkészületek

1. Áttekintés

  • Az R barátságosabbá tétele, R és elérhető GUI-k
  • Rstudio
  • Kapcsolódó szoftverek és dokumentáció
  • R és statisztika
  • Az R interaktív használata
  • Bevezető foglalkozás
  • Segítségkérés függvényekkel és funkciókkal kapcsolatban
  • R parancsok, kis- és nagybetűk érzékenysége stb.
  • Korábbi parancsok visszahívása és javítása
  • Parancsok végrehajtása fájlból vagy kimenet átirányítása fájlba
  • Adatmaradás és objektumok eltávolítása
  • Jó programozási gyakorlat: Önálló szkriptek, jó olvashatóság, pl. strukturált szkriptek, dokumentáció, markdown
  • Csomagok telepítése; CRAN és Bioconductor

2. Adatok beolvasása

  • Txt fájlok (read.delim)
  • CSV fájlok

3. Egyszerű műveletek; számok és vektorok + tömbök

  • Vektorok és értékadás
  • Vektoraritmetika
  • Szabályos sorozatok generálása
  • Logikai vektorok
  • Hiányzó értékek
  • Karaktervektorok
  • Indexvektorok; adathalmazok részhalmazainak kiválasztása és módosítása
    • Tömbök
  • Tömbindexelés. Tömbök részei
  • Indexmátrixok
  • Az array() függvény + egyszerű műveletek tömbökön, pl. szorzás, transzponálás
  • Egyéb típusú objektumok

4. Listák és adatkeretek

  • Listák
  • Listák létrehozása és módosítása
    • Listák összefűzése
  • Adatkeretek
    • Adatkeretek létrehozása
    • Adatkeretekkel való munka
    • Tetszőleges listák csatolása
    • A keresési útvonal kezelése

5. Adatmanipuláció

  • Megfigyelések és változók kiválasztása, részhalmazok
  • Szűrés, csoportosítás
  • Átkódolás, transzformációk
  • Aggregálás, adathalmazok kombinálása
  • Particionált mátrixok létrehozása, cbind() és rbind()
  • A konkatenációs függvény, (), tömbökkel
  • Karaktermanipuláció, stringr csomag
  • Rövid bevezetés a grep és regexpr használatába

6. Továbbiak az adatok beolvasásáról

  • XLS, XLSX fájlok
  • readr és readxl csomagok
  • SPSS, SAS, Stata,… és egyéb formátumú adatok
  • Adatok exportálása txt, csv és egyéb formátumokba

6. Csoportosítás, ciklusok és feltételes végrehajtás

  • Csoportos kifejezések
  • Vezérlési utasítások
  • Feltételes végrehajtás: if utasítások
  • Ismétlődő végrehajtás: for ciklusok, repeat és while
  • Bevezetés az apply, lapply, sapply, tapply használatába

7. Függvények

  • Függvények létrehozása
  • Opcionális argumentumok és alapértelmezett értékek
  • Változó számú argumentumok
  • Hatókör és annak következményei

8. Egyszerű grafikák az R-ben

  • Grafikon készítése
  • Sűrűségi ábrák
  • Pontdiagramok
  • Oszlopdiagramok
  • Vonaldiagramok
  • Kördiagramok
  • Boxplotok
  • Pontdiagramok
  • Grafikonok kombinálása

II. Statisztikai elemzés az R-ben

1. Valószínűségi eloszlások

  • Az R mint statisztikai táblázatok gyűjteménye
  • Adathalmaz eloszlásának vizsgálata

2. Hipotézisvizsgálatok

  • Teszt egy populáció átlagáról
  • Likelihood Ratio Teszt
  • Egy- és kétmintás tesztek
  • Khi-négyzet illeszkedésvizsgálat
  • Kolmogorov-Smirnov egy mintás statisztika
  • Wilcoxon előjeles rangpróba
  • Kétmintás próba
  • Wilcoxon rangösszeg-próba
  • Mann-Whitney-próba
  • Kolmogorov-Smirnov-próba

3. Többszörös hipotézisvizsgálat

  • I. típusú hiba és FDR
  • ROC görbék és AUC
  • Többszörös tesztelési eljárások (BH, Bonferroni stb.)

4. Lineáris regressziós modellek

  • Általános függvények modellinformációk kinyeréséhez
  • Frissített modellek
  • Általánosított lineáris modellek
    • Családok
    • A glm() függvény
  • Osztályozás
    • Logisztikus regresszió
    • Lineáris diszkriminanciaanalízis
  • Felügyelet nélküli tanulás
    • Főkomponens-analízis
    • Csoportosítási módszerek (k-means, hierarchikus csoportosítás, k-medoids)

5. Túlélésanalízis (survival csomag)

  • Túlélési objektumok az R-ben
  • Kaplan-Meier becslés, log-rank teszt, parametrikus regresszió
  • Konfidenciaintervallumok
  • Cenzorált (intervallum cenzorált) adatelemzés
  • Cox PH modellek, állandó kovariánsok
  • Cox PH modellek, időfüggő kovariánsok
  • Szimuláció: Modellösszehasonlítás (Regressziós modellek összehasonlítása)

6. Varianciaanalízis

  • Egytényezős varianciaanalízis
  • Kétirányú varianciaanalízis
  • MANOVA

III. Kidolgozott problémák a bioinformatikában

  • Rövid bevezetés a limma csomagba
  • Mikroarray adatelemzési munkafolyamat
  • Adatok letöltése a GEO-ról: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Adatfeldolgozás (QC, normalizálás, differenciális expresszió)
  • Vulkán ábra
  • Csoportosítási példák + hőtérképek
 28 Órák

Résztvevők száma


Ár per résztvevő

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák