62670 Statistisk Analyse og Datavisualisering

2024/2025

Kursusinformation
Statistical Analysis and Data visualisation
Engelsk
5
Diplomingeniør
Obligatorisk kursus (B Eng), se flere
Obligatorisk kursus (B Eng), Global Business og Engineering
Obligatorisk kursus (B Eng), Mobilitet, transport og logistik
Obligatorisk kursus (B Eng), Proces og innovation
Obligatorisk kursus (B Eng), Sundhedsteknologi
Tilvalgskursus (B Eng), Produktion
E4B (fre 8-12)
F4A (tirs 13-17)
Campus Ballerup
Kurset består af forelæsninger og øvelsessessioner med vægt på brug af R. Der er et obligatorisk projekt, der kan laves i grupper på 4-5 personer.
13-uger
E4B, F4A
Skriftlig eksamen og bedømmelse af rapport(er)
Kursuskarakteren er baseret på et vægtet gennemsnit på 70%/30% for den skriftlige eksamen og projektrapporten.
Skriftlig eksamen: 3 timer
Alle hjælpemidler - uden adgang til internettet
7-trins skala , intern bedømmelse
62668 Statistik, 62669 og 62429 Datavisualisering
62668/62429/62022/62518
01901/01920 , Basismat 1, Basismat 2
Iver Mølgaard Ottosen , Ballerup Campus, Bygning Ballerup , ivot@dtu.dk
Deena Francis (Primær kontaktperson) , Ballerup Campus, Bygning Ballerup , dfra@dtu.dk
62 Institut for Ingeniørteknologi og -didaktik
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At give de studerende en grundlæggende statistisk, datarelateret begrebsforståelse. At træne de studerende i datavisualisering og anvendelser af statistiske analysemetoder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Anvende sandsynlighedsteoriens principper til at løse et givent problem.
  • Oprette oversigter og visualiseringer af et givent datasæt.
  • Estimere egenskaber for en population og kvantificere usikkerheden af estimatet ved hjælp af konfidensintervaller.
  • Udføre en ensidet Students t test på et givet datasæt.
  • Udføre en Welchs test på et givet datasæt.
  • Udføre estimering af enkelte og flere forhold.
  • Test for lineær afhængighed af data ved hjælp af lineær regression.
  • Anvende Students t-test på data i en multiple lineær regressions setup.
  • Udføre analyse og forudsigelse for tidsrække data på et givet datasæt.
  • Udføre statistiske test på data, der ikke har normalitetsantagelser.
  • Beregne de fælles, marginale og betingede sandsynligheder for en given problemstilling.
Kursusindhold
- Grundlæggende om sandsynlighed: tilfældige eksperimenter, hændelser, stikprøverum, sandsynligheder, regler for beregning af sandsynligheder, Bayes' sætning, uafhængighed og afhængighed.

- Fordelinger: stokastiske variable - diskrete og kontinuerte, fordelingsfunktioner, fordelingsegenskaber - middelværdi og varians, kvantiler.

- Diskrete fordelinger: Bernoulli, binomial, Poisson og uniforme fordelinger.

- Kontinuerte fordelinger: uniform, eksponentiel, Poisson, normal, chi-i-anden, Students t og F-fordelinger.

- Flerdimensionale stokastiske variable: simultane, marginale og betingede fordelinger.

- Dataanalyse: beskrivende statistik, måling af sammenhæng ved hjælp af kovarians og korrelation.

- Estimationsproblemet: stikprøve, population, konfidensintervaller, den centrale grænsesætning.

- Statistisk hypotesetestning: teststatistik, signifikansniveau, p-værdi.

- Lineær regression: enkel og multipel, model fit, forudsigelse.

- Tidsrækkeanalyse: additive og multiplikative modeller, tendenser og sæsonvariation, prognoser.

R: analyse og visualisering af data ved hjælp af R, beregning, udførelse af hypotesetestning, tilpasning og forudsigelse.
Litteraturhenvisninger
Online E-lærebog for kurset 02323 Introduktion til Statistik,
https:/​/​02323.compute.dtu.dk/​book
Bemærkninger
Sektion for AI, matematik og software
Mobilitet, Transport og Logistik: 2. semester
Proces og Innovation: 3. semester
Sundhedsteknologi: 4 semester
Global Business Engineering
Sidst opdateret
02. maj, 2024