62429 Data visualisering og analyse - værktøjer og metoder.

2018/2019

Informatik (100)
Proces & innovation: 3. sem.
Kursusinformation
Data visualization and analysis - tools and methods.
Dansk
5
Diplomingeniør
E5A (ons 8-12)
Campus Ballerup
Kursussessioner under aktiv medvirken af de studerende og projektarbejde
13-uger
E5A, Ved store hold kan eksamen fordeles over flere dage.
Mundtlig eksamen og bedømmelse af opgave(r)
bestået/ikke bestået , intern bedømmelse
62022
62022
John Aasted Sørensen , Ballerup Campus, Bygning Ballerup, Tlf. (+45) 3588 5235 , jaas@dtu.dk

62 DTU Diplom
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Formålet med kurset er at give den studerende en forståelse for forskellige typer data og deres fordelinger og hvordan disse visualiseres og analyseres ved anvendelse af open source værktøjer. Yderligere er det formålet med kurset at den studerende bliver i stand til at anvende estimationsmetoder for middelværdi, varians, spredning, konfidensinterval og regression og anvende dette ved opstilling og anvendelse af statistisk model for hypotesetest.
Endelig er formålet med kurset at introducere til begreber i klyngeanalyse og klassifikation af data.
De grundlæggende matematiske modeller introduceres under anvendelse af open-source værktøjer og hands-on eksempler.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Forstå datatyper: kontinuerte -, ordnede - og kategoridata.
  • Forstå og anvende datavisualisering, herunder plot, scatterplot, histogram, boxplot, Quantile-Quantile plot, 3D plot med brugerdefineret synsretning.
  • Forstå sandsynlighedsbegrebet og sandsynlighedsfordelinger, kontinuert og diskret.
  • Forstå og anvende diskrete sandsynlighedsfordelinger, uniform, binomial.
  • Forstå og anvende normalfordelingen.
  • Forstå og anvende estimationsmetode, middelværdi, varians, spredning
  • Forstå den centrale grænseværdisætning (CLT).
  • Forstå og anvende konfidensinterval for middelværdi og konfidensinterval for differens mellem middelværdier.
  • Forstå og anvende lineær regression.
  • Forstå og anvende hypotesetest som grundlag for statistisk analyse.
  • Forstå og anvende indledende begreber i klyngeanalyse.
  • Forstå og anvende indledende begreber i klassifikation.
Kursusindhold
Kontinuerte -, ordnede –, og kategoridata; scatterplot; histogram; boxplot; QQ plot; 3D plot; sansynlighedsfordeling, kontinuert og diskret; uniform -, binomial - og normalfordelingen; estimation middelværdi, spredning; CLT; konfidensinterval; lineær regression; hypotese test, H0, H1; klyngeanalyse; klassifikation; R; RStudio; hands-on.
Litteraturhenvisninger
Peter Dalgaard, "Introductory Statistics with R", Second Edition, Springer, 2008.
Bemærkninger
Kurset gives i et samarbejde med Thomas Kallemose, statistiker, Klinisk Forskningscenter, Hvidovre Hospital.
Sidst opdateret
04. maj, 2018