Overordnede kursusmål
At give de studerende en grundlæggende statistisk, datarelateret
begrebsforståelse. At træne de studerende i datavisualisering og
anvendelser af statistiske analysemetoder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Karakterisere et tilfældigt eksperiment og datatyperne:
Diskrete og kontinuerte data.
- Anvende, fremstille og fortolke visualiseringerne: Scatterplot,
histogram, boxplot og quantile-quantile plot.
- Anvende og forstå sandsynlighedsbegrebet og
sandsynlighedsfordelinger i både det diskrete og det kontinuerte
tilfælde.
- Forstå og anvende de diskrete sandsynlighedsfordelinger:
Uniform, Bernoulli, Binomial og Poisson ved benyttelse af
programmet R.
- Forstå og anvende de kontinuerte sandsynlighedsfordelinger:
Uniform, eksponential og normalfordeling med relateret benyttelse
af programmet R.
- Fortolke og anvende estimationsmetoder for middelværdi, varians
og fraktiler.
- Fortolke og anvende konfidensintervaller for middelværdi og
differens mellem middelværdier.
- Fortolke og anvende den centrale grænseværdisætning.
- Forstå, fortolke og anvende en lineær regressionsanalyse.
- Forstå og anvende hypotesetest som grundlag for en statistisk
analyse.
- Bruge R til fremstilling af en samlet beskrivende statistik for
et datasæt.
Kursusindhold
Tilfældige eksperimenter, hændelsesbegrebet. Udfaldsrum og
datatyper for observationer. Optælling af elementarhændelser,
permutationer og kombinationer.
Sandsynlighedsregning, sumregel, produktregel, Bayes’ sætning.
Stokastisk afhængighed og uafhængighed.
Diskrete stokastiske variable, generelt: Definitionsgrundlag,
udfaldsrum, frekvens- og fordelingsfunktion, middelværdi og
varians.
Diskrete fordelinger: Bernoullifordelingen. Binomialfordelingen.
Poissonfordelingen. Ligefordelingen.
Kontinuerte stokastiske variable generelt: Definitionsgrundlag,
udfaldsrum, frekvens- og fordelingsfunktion, middelværdi og
varians, fraktiler.
Kontinuerte fordelinger: Ligefordelingen. Eksponentialfordelingen.
Normalfordelingen.
Chi-i-anden-fordelingen, Student’s t-fordeling, F-fordelingen.
Flerdimensionale stokastiske variable. Simultane, marginale og
betingede fordelinger. Kovarians, korrelation.
Estimation af parametre i statistiske modeller og
konfidensintervaller for parametre.
Hypotesetest, signifikansniveau, P-værdi. Lineære
regressionsmodeller.
Beskrivende statistik, sammenhængen mellem empiri og model.
Programmet R benyttes til anvendelser, analyser og visualiseringer,
samt til at understøtte teorien.
Litteraturhenvisninger
Online E-lærebog for kurset 02323 Introduktion til Statistik,
https://02323.compute.dtu.dk/bookBemærkninger
Faggruppe: AI, matematik og software
Mobilitet, Transport og Logistik: 2. semester
Proces og Innovation: 3. semester
Produktion: 3. semester
Sundhedsteknologi: 4 semester
Sidst opdateret
10. januar, 2024