62669 Statistisk Analyse og Datavisualisering

2023/2024

Kursusinformation
Statistical Analysis and Data visualisation
Engelsk
5
Diplomingeniør
E4B (fre 8-12)
F4A (tirs 13-17)
Campus Ballerup
Klasseundervisning og øvelsessessioner. Præsentation af teori, suppleret med eksempler og anvendelse af programmet R. Der stilles 2 obligatoriske, skriftlige kursusopgaver af beregningsmæssig karakter til styrkelse af forståelsen og beherskelsen af begreber og metoder. Programmet R bruges som beregningsplatform. Det anbefales at de studerende samarbejder i grupper på 3-4 personer.
13-uger
E4B, F4A
Skriftlig eksamen og bedømmelse af rapport(er)
Kursuskarakteren baseres på et 70%/30% vægtet gennemsnit af den skriftlige eksamen og projektrapporterne.
Skriftlig eksamen: 3 timer
Alle hjælpemidler er tilladt
7-trins skala , intern bedømmelse
62668 Statistik og 62429 Datavisualisering
62668/62429/62022/62518
01901/01920 , Basismat 1, Basismat 2
Iver Mølgaard Ottosen , Ballerup Campus, Bygning Ballerup , ivot@dtu.dk
Deena Francis (Primær kontaktperson) , Ballerup Campus, Bygning Ballerup , dfra@dtu.dk
62 Institut for Ingeniørteknologi og -didaktik
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At give de studerende en grundlæggende statistisk, datarelateret begrebsforståelse. At træne de studerende i datavisualisering og anvendelser af statistiske analysemetoder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Karakterisere et tilfældigt eksperiment og datatyperne: Diskrete og kontinuerte data.
  • Anvende, fremstille og fortolke visualiseringerne: Scatterplot, histogram, boxplot og quantile-quantile plot.
  • Anvende og forstå sandsynlighedsbegrebet og sandsynlighedsfordelinger i både det diskrete og det kontinuerte tilfælde.
  • Forstå og anvende de diskrete sandsynlighedsfordelinger: Uniform, Bernoulli, Binomial og Poisson ved benyttelse af programmet R.
  • Forstå og anvende de kontinuerte sandsynlighedsfordelinger: Uniform, eksponential og normalfordeling med relateret benyttelse af programmet R.
  • Fortolke og anvende estimationsmetoder for middelværdi, varians og fraktiler.
  • Fortolke og anvende konfidensintervaller for middelværdi og differens mellem middelværdier.
  • Fortolke og anvende den centrale grænseværdisætning.
  • Forstå, fortolke og anvende en lineær regressionsanalyse.
  • Forstå og anvende hypotesetest som grundlag for en statistisk analyse.
  • Bruge R til fremstilling af en samlet beskrivende statistik for et datasæt.
Kursusindhold
Tilfældige eksperimenter, hændelsesbegrebet. Udfaldsrum og datatyper for observationer. Optælling af elementarhændelser, permutationer og kombinationer.
Sandsynlighedsregning, sumregel, produktregel, Bayes’ sætning.
Stokastisk afhængighed og uafhængighed.
Diskrete stokastiske variable, generelt: Definitionsgrundlag, udfaldsrum, frekvens- og fordelingsfunktion, middelværdi og varians.
Diskrete fordelinger: Bernoullifordelingen. Binomialfordelingen. Poissonfordelingen. Ligefordelingen.
Kontinuerte stokastiske variable generelt: Definitionsgrundlag, udfaldsrum, frekvens- og fordelingsfunktion, middelværdi og varians, fraktiler.
Kontinuerte fordelinger: Ligefordelingen. Eksponentialfordelingen. Normalfordelingen.
Chi-i-anden-fordelingen, Student’s t-fordeling, F-fordelingen.
Flerdimensionale stokastiske variable. Simultane, marginale og betingede fordelinger. Kovarians, korrelation.
Estimation af parametre i statistiske modeller og konfidensintervaller for parametre.
Hypotesetest, signifikansniveau, P-værdi. Lineære regressionsmodeller.
Beskrivende statistik, sammenhængen mellem empiri og model.
Programmet R benyttes til anvendelser, analyser og visualiseringer, samt til at understøtte teorien.
Litteraturhenvisninger
Online E-lærebog for kurset 02323 Introduktion til Statistik,
https:/​/​02323.compute.dtu.dk/​book
Bemærkninger
Faggruppe: AI, matematik og software
Mobilitet, Transport og Logistik: 2. semester
Proces og Innovation: 3. semester
Produktion: 3. semester
Sundhedsteknologi: 4 semester
Sidst opdateret
10. januar, 2024