Overordnede kursusmål
At give de studerende en grundlæggende statistisk, datarelateret
begrebsforståelse. At træne de studerende i datavisualisering og
anvendelser af statistiske analysemetoder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Anvende sandsynlighedsteoriens principper til at løse et givent
problem.
- Oprette oversigter og visualiseringer af et givent
datasæt.
- Estimere egenskaber for en population og kvantificere
usikkerheden af estimatet ved hjælp af konfidensintervaller.
- Udføre en ensidet Students t test på et givet datasæt.
- Udføre en Welchs test på et givet datasæt.
- Udføre estimering af enkelte og flere forhold.
- Test for lineær afhængighed af data ved hjælp af lineær
regression.
- Anvende Students t-test på data i en multiple lineær
regressions setup.
- Udføre analyse og forudsigelse for tidsrække data på et givet
datasæt.
- Udføre statistiske test på data, der ikke har
normalitetsantagelser.
- Beregne de fælles, marginale og betingede sandsynligheder for
en given problemstilling.
Kursusindhold
- Grundlæggende om sandsynlighed: tilfældige eksperimenter,
hændelser, stikprøverum, sandsynligheder, regler for beregning af
sandsynligheder, Bayes' sætning, uafhængighed og afhængighed.
- Fordelinger: stokastiske variable - diskrete og kontinuerte,
fordelingsfunktioner, fordelingsegenskaber - middelværdi og
varians, kvantiler.
- Diskrete fordelinger: Bernoulli, binomial, Poisson og uniforme
fordelinger.
- Kontinuerte fordelinger: uniform, eksponentiel, Poisson, normal,
chi-i-anden, Students t og F-fordelinger.
- Flerdimensionale stokastiske variable: simultane, marginale og
betingede fordelinger.
- Dataanalyse: beskrivende statistik, måling af sammenhæng ved
hjælp af kovarians og korrelation.
- Estimationsproblemet: stikprøve, population,
konfidensintervaller, den centrale grænsesætning.
- Statistisk hypotesetestning: teststatistik, signifikansniveau,
p-værdi.
- Lineær regression: enkel og multipel, model fit, forudsigelse.
- Tidsrækkeanalyse: additive og multiplikative modeller, tendenser
og sæsonvariation, prognoser.
R: analyse og visualisering af data ved hjælp af R, beregning,
udførelse af hypotesetestning, tilpasning og forudsigelse.
Litteraturhenvisninger
Online E-lærebog for kurset 02323 Introduktion til Statistik,
https://02323.compute.dtu.dk/bookBemærkninger
Sektion for AI, matematik og software
Mobilitet, Transport og Logistik: 2. semester
Proces og Innovation: 3. semester
Sundhedsteknologi: 4 semester
Global Business Engineering
Sidst opdateret
02. maj, 2024