Overordnede kursusmål
Formålet med kurset er at give den studerende en forståelse for
forskellige typer data og deres fordelinger og hvordan disse
visualiseres og analyseres ved anvendelse af open source værktøjer.
Yderligere er det formålet med kurset at den studerende bliver i
stand til at anvende estimationsmetoder for middelværdi, varians,
spredning, konfidensinterval og regression og anvende dette ved
opstilling og anvendelse af statistisk model for hypotesetest.
Endelig er formålet med kurset at introducere til begreber i
klyngeanalyse og klassifikation af data.
De grundlæggende matematiske modeller introduceres under anvendelse
af open-source værktøjer og hands-on eksempler.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forstå datatyper: kontinuerte -, ordnede - og
kategoridata.
- Forstå og anvende datavisualisering, herunder plot,
scatterplot, histogram, boxplot, Quantile-Quantile plot, 3D plot
med brugerdefineret synsretning.
- Forstå sandsynlighedsbegrebet og sandsynlighedsfordelinger,
kontinuert og diskret.
- Forstå og anvende diskrete sandsynlighedsfordelinger, uniform,
binomial.
- Forstå og anvende normalfordelingen.
- Forstå og anvende estimationsmetode, middelværdi, varians,
spredning
- Forstå den centrale grænseværdisætning (CLT).
- Forstå og anvende konfidensinterval for middelværdi og
konfidensinterval for differens mellem middelværdier.
- Forstå og anvende lineær regression.
- Forstå og anvende hypotesetest som grundlag for statistisk
analyse.
- Forstå og anvende indledende begreber i klyngeanalyse.
- Forstå og anvende indledende begreber i
klassifikation.
Kursusindhold
Kontinuerte -, ordnede –, og kategoridata; scatterplot; histogram;
boxplot; QQ plot; 3D plot; sansynlighedsfordeling, kontinuert og
diskret; uniform -, binomial - og normalfordelingen; estimation
middelværdi, spredning; CLT; konfidensinterval; lineær regression;
hypotese test, H0, H1; klyngeanalyse; klassifikation; R; RStudio;
hands-on.
Litteraturhenvisninger
Peter Dalgaard, "Introductory Statistics with R", Second
Edition, Springer, 2008.
Bemærkninger
Kurset gives i et samarbejde med Thomas Kallemose, statistiker,
Klinisk Forskningscenter, Hvidovre Hospital.
Sidst opdateret
04. maj, 2018