62670 Statistisk Analyse og Datavisualisering

2025/2026

Kursusinformation
Statistical Analysis and Data visualisation
Engelsk
5
Diplomingeniør
E4B (fre 8-12)
F4A (tirs 13-17)
Campus Ballerup
Kurset består af forelæsninger og øvelsessessioner med vægt på brug af R. Der er et obligatorisk projekt, der kan laves i grupper på 4-5 personer.
13-uger
E4B, F4A
Skriftlig eksamen og bedømmelse af rapport(er)
Kursuskarakteren er baseret på et vægtet gennemsnit på 70%/30% for den skriftlige eksamen og projektrapporten.
Skriftlig eksamen: 3 timer
Alle hjælpemidler - uden adgang til internettet
7-trins skala , intern bedømmelse
62668 Statistik, 62669 og 62429 Datavisualisering
62668/62429/62022/62518
01911/01922 , Matematisk Analyse og Modellering, Lineær Algebra og Modellering
Iver Mølgaard Ottosen , Ballerup Campus, Bygning Ballerup , ivot@dtu.dk
Deena Francis (Primær kontaktperson) , Ballerup Campus, Bygning Ballerup , dfra@dtu.dk
62 Institut for Ingeniørteknologi og -didaktik
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At give de studerende en grundlæggende statistisk, datarelateret begrebsforståelse. At træne de studerende i datavisualisering og anvendelser af statistiske analysemetoder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Anvende sandsynlighedsteoriens principper til at løse et givent problem.
  • Oprette oversigter og visualiseringer af et givent datasæt.
  • Estimere egenskaber for en population og kvantificere usikkerheden af estimatet ved hjælp af konfidensintervaller.
  • Udføre en ensidet Students t test på et givet datasæt.
  • Udføre en Welchs test på et givet datasæt.
  • Udføre estimering af enkelte og flere forhold.
  • Test for lineær afhængighed af data ved hjælp af lineær regression.
  • Anvende Students t-test på data i en multiple lineær regressions setup.
  • Udføre analyse og forudsigelse for tidsrække data på et givet datasæt.
  • Udføre statistiske test på data, der ikke har normalitetsantagelser.
  • Beregne de fælles, marginale og betingede sandsynligheder for en given problemstilling.
Kursusindhold
- Grundlæggende om sandsynlighed: tilfældige eksperimenter, hændelser, stikprøverum, sandsynligheder, regler for beregning af sandsynligheder, Bayes' sætning, uafhængighed og afhængighed.

- Fordelinger: stokastiske variable - diskrete og kontinuerte, fordelingsfunktioner, fordelingsegenskaber - middelværdi og varians, kvantiler.

- Diskrete fordelinger: Bernoulli, binomial, Poisson og uniforme fordelinger.

- Kontinuerte fordelinger: uniform, eksponentiel, Poisson, normal, chi-i-anden, Students t og F-fordelinger.

- Flerdimensionale stokastiske variable: simultane, marginale og betingede fordelinger.

- Dataanalyse: beskrivende statistik, måling af sammenhæng ved hjælp af kovarians og korrelation.

- Estimationsproblemet: stikprøve, population, konfidensintervaller, den centrale grænsesætning.

- Statistisk hypotesetestning: teststatistik, signifikansniveau, p-værdi.

- Lineær regression: enkel og multipel, model fit, forudsigelse.

- Tidsrækkeanalyse: additive og multiplikative modeller, tendenser og sæsonvariation, prognoser.

R: analyse og visualisering af data ved hjælp af R, beregning, udførelse af hypotesetestning, tilpasning og forudsigelse.
Litteraturhenvisninger
Online E-lærebog for kurset 02323 Introduktion til Statistik,
https:/​/​02323.compute.dtu.dk/​book
Bemærkninger
Sektion for Ingeniørdidaktik og -pædagogik
Mobilitet, Transport og Logistik: 2. semester
Proces og Innovation: 3. semester
Sundhedsteknologi: 4 semester
Global Business Engineering
Sidst opdateret
02. maj, 2025