Overordnede kursusmål
At give de studerende en grundlæggende statistisk, datarelateret
begrebsforståelse og træning i anvendelse af statistiske
analysemetoder datavisualisering af en foreliggende datamængde.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Karakterisere et tilfældigt eksperiment og datatyperne:
Diskrete, kategoriske og kontinuerte data.
- Anvende, fremstille og fortolke visualiseringerne: Scatterplot,
histogram, boxplot,quantile-quantile plot og 3D plot med
brugerdefineret observationspunkt.
- Anvende og forstå sandsynlighedsbegrebet og
sandsynlighedsfordelinger i både det diskrete og det kontinuerte
tilfælde.
- Forstå og anvende de diskrete sandsynlighedsfordelinger:
Uniform, Bernoully, Binomial, Poisson og hypergeometrisk ved
benyttelse af programmet R.
- Forstå og anvende de kontinuerte sandsynlighedsfordelinger:
Uniform, eksponential og normalfordeling med relateret benyttelse
af programmet R.
- Fortolke og anvende estimationsmetoder for middelværdi, varians
og fraktiler.
- Fortolke og anvende konfidensintervaller for middelværdi og
differens mellem middelværdier.
- Fortolke og anvende den centrale grænseværdisætning.
- Forstå, fortolke og anvende en lineær regressionsanalyse.
- Forstå og anvende hypotesetest som grundlag for en statistisk
analyse.
- Forstå og anvende grundlæggende begreber for klyngeanalyse og
klassifikation.
- Bruge R til fremstilling af en samlet beskrivende statistik for
et datasæt.
Kursusindhold
Et tilfældigt eksperiment, hændelsesbegrebet. Udfaldsrum og
datatyper for observationer.
Venn-diagrammer. Optælling af elementarhændelser, permutationer og
kombinationer.
Sandsynlighedsregning, sumregel, produktregel, Bayes’ sætning.
Stokastisk afhængighed og uafhængighed.
Diskrete stokastiske variable, generelt: Definitionsgrundlag,
udfaldsrum, frekvens- og fordelingsfunktion, middelværdi og
varians.
Diskrete fordelinger: Bernoullyfordelingen. Binomialfordelingen.
Den hypergeometriske fordeling. Poissonfordelingen.
Ligefordelingen.
Kontinuerte stokastiske variable generelt: Definitionsgrundlag,
udfaldsrum, frekvens- og fordelingsfunktion, middelværdi og
varians, fraktiler.
Kontinuerte fordelinger: Ligefordelingen. Eksponentialfordelingen.
Normalfordelingen.
Chi-i-anden-fordelingen, Student’s t-fordeling, F-fordelingen.
Flerdimensionale stokastiske variable. Simultane, marginale og
betingede fordelinger. Kovarians, korrelation.
Estimation af parametre i statistiske modeller og
konfidensintervaller for parametre.
Hypotesetest, signifikansniveau, P-værdi. Lineære
regressionsmodeller.
Beskrivende statistik, sammenhængen mellem empiri og model.
Anvendelse af R til understøttelse af teori, anvendelse, analyse og
visualisering af det samlede statistiske begrebsapparat.
Litteraturhenvisninger
Peter Dalgaard, "Introductory Statistics with R", Second
Edition, Springer 2008
Sidst opdateret
28. maj, 2021