Schița de curs

I. Introducere și preliminarii

1. Prezentare generală

  • R mai prietenos, R și interfețele grafice disponibile
  • Rstudio
  • Software și documentație conexe
  • R și statisticile
  • Utilizarea interactivă a R
  • O sesiune introductivă
  • Obținerea de ajutor cu funcții și caracteristici
  • Comenzile R, sensibilitatea la majuscule, etc.
  • Reamintirea și corectarea comenzilor anterioare
  • Executarea comenzilor dintr-un fișier sau redirecționarea rezultatelor către un fișier
  • Permanența datelor și eliminarea obiectelor
  • Good practică de programare: scripturi autoconținute, bună lizibilitate, de exemplu scripturi structurate, documentație, markdown
  • instalarea pachetelor; CRAN și Bioconductor

2. Citirea datelor

  • Fișiere Txt (read.delim)
  • Fișiere CSV

3. Manipulări simple; numere și vectori + matrici

  • Vectori și atribuire
  • Aritmetica vectorială
  • Generarea secvențelor regulate
  • Vectori logici
  • Valori lipsă
  • Vectori de caractere
  • Vectori index; selectarea și modificarea subansamblurilor unui set de date
    • Array-uri
  • Indexarea matricei. Subsecțiuni ale unui array
  • Matrici de indexare
  • Funcția array() + operații simple asupra array-urilor, de exemplu înmulțire, transpunere
  • Alte tipuri de obiecte

4. Liste și cadre de date

  • Liste
  • Construirea și modificarea listelor
    • Concatenarea listelor
  • Cadre de date
    • Crearea cadrelor de date
    • Lucrul cu cadre de date
    • Atașarea de liste arbitrare
    • Gestionarea căii de căutare

5. Manipularea datelor

  • Selectarea, subgrupul de observații și variabile
  • Filtrare, grupare
  • Recodare, transformări
  • Agregarea, combinarea seturilor de date
  • Formarea matricelor partiționate, cbind() și rbind()
  • Funcția de concatenare, (), cu matrici
  • Manipularea caracterelor, pachetul stringr
  • scurtă introducere în grep și regexpr

6. Mai multe despre citirea datelor

  • Fișiere XLS, XLSX
  • pachetele readr și readxl
  • Date SPSS, SAS, Stata,... și alte formate
  • Exportul datelor în format txt, csv și alte formate

6. Gruparea, buclele și execuția condiționată

  • Expresii grupate
  • Instrucțiuni de control
  • Execuție condiționată: instrucțiuni if
  • Execuție repetitivă: bucle for, repeat și while
  • Introducere în apply, lapply, sapply, tapply

7. Funcții

  • Crearea funcțiilor
  • Argumente opționale și valori implicite
  • Numărul variabil de argumente
  • Domeniul de aplicare și consecințele acestuia

8. Grafice simple în R

  • Crearea unui grafic
  • Diagrame de densitate
  • Diagrame cu puncte
  • Diagrame cu bare
  • Diagrame de linii
  • Diagrame plăcintă
  • Diagrame boxplot
  • Diagrame Scatter
  • Combinarea diagramelor

II. Analiza statistică în R

1. Distribuții de probabilitate

  • R ca set de tabele statistice
  • Examinarea distribuției unui set de date

2. Testarea ipotezelor

  • Teste privind media unei populații
  • Testul raportului de verosimilitate
  • Teste cu unul și două eșantioane
  • Testul Goodness-of-Fit Chi-Square
  • Statistica Kolmogorov-Smirnov pentru o singură probă
  • Testul Wilcoxon Signed-Rank
  • Test cu două eșantioane
  • Testul Wilcoxon Rank Sum
  • Testul Mann-Whitney
  • Testul Kolmogorov-Smirnov

3. Testarea multiplă a ipotezelor

  • Eroarea de tip I și FDR
  • Curbe ROC și AUC
  • Proceduri de testare multiplă (BH, Bonferroni etc.)

4. Modele de regresie liniară

  • Funcții generice pentru extragerea informațiilor despre model
  • Actualizarea modelelor ajustate
  • Modele liniare generalizate
    • Familii
    • Funcția glm()
  • Clasificare
    • Regresia logistică
    • Analiza discriminantă liniară
  • Învățare nesupravegheată
    • Analiza componentelor principale
    • Metode de clusterizare (k-means, clusterizare ierarhică, k-medoids)

5. Analiza supraviețuirii (pachetul survival)

  • Obiecte de supraviețuire în r
  • Estimarea Kaplan-Meier, testul log-rank, regresia parametrică
  • Benzile de încredere
  • Analiza datelor cenzurate (cenzurate prin intervale)
  • Modele Cox PH, covariate constante
  • Modele Cox PH, covariate dependente de timp
  • Simulare: Compararea modelelor (compararea modelelor de regresie)

6. Analiza varianței

  • ANOVA într-o singură direcție
  • Clasificarea ANOVA pe două căi
  • MANOVA

III. Probleme de lucru în bioinformatică

  • Scurtă introducere în pachetul limma
  • Flux de lucru pentru analiza datelor microarray
  • Descărcarea datelor din GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Prelucrarea datelor (QC, normalizare, expresie diferențială)
  • Grafic vulcanic
  • Exemple Custering + heatmaps
 28 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Upcoming Courses

Categorii înrudite