42588 Data og data science

2022/2023

Obligatorisk kursus for BSc'en i Data Science og Management. Forbeholdt disse studerende.
Kursusinformation
Data and data science
Dansk
5
Bachelor
F5B (ons 13-17)
Campus Lyngby
13-uger
F5B
Bedømmelse af opgave(r)/rapport(er)
Evalueringen er baseret på en quiz og to gruppeprojekter.
7-trins skala , intern bedømmelse
(02402/02403).02450 , Intro til statistik og intro til machine learning kan med fordel følges før kurset
Stefan Eriksen Mabit , Lyngby Campus, Bygning 358, Tlf. (+45) 4525 1510 , smab@dtu.dk
Jeppe Rich , Lyngby Campus, Bygning 358, Tlf. (+45) 4525 1536 , rich@dtu.dk
42 Institut for Teknologi, Ledelse og Økonomi
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Kurset handler om de udfordringer, som opstår når man forsøger at besvare spørgsmål vha. data og forskellige tilgange til at løse disse udfordringer. Kursets hovedemne er derfor data, og dækker viden om forskellige typer af data og måder at indsamle og behandle data. Kurset introducerer forskellige tilgange til deskriptiv analyse, datavisualisering og -analyse. Kurset har også som formål at give de studerende et overblik over forskellige skoler inden for statistik og data science, som alle bidrager med forskellige tilgange til at besvare spørgsmål vha. data f.eks. statistisk analyse vs. machine learning og frekventistiske vs. bayesianske tilgange.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • diskutere forholdet mellem problemstilling, metode og data
  • beskrive forskellige typer af data og dataindsamling
  • diskutere data governance f.eks. GDPR og FAIR principper
  • producere en data management plan
  • diskutere og anvende værktøjer til databehandling f.eks. imputation, sampling og vægtning
  • benytte data til at besvare relevante spørgsmål
  • foretage en deskriptiv analyse og visualisere data
  • diskutere forskellen mellem forskellige tilgange til statistik/data science
  • anvende standardmetoder til analyse af kontinuerte og diskrete data
  • præsentere fokuserede og koncise dataanalyser
Kursusindhold
Kurset præsenterer generelle aspekter af data og dataindsamling. Samtidig giver det en introduktion til de forskellige datakategorier og deres kendetegn f.eks. observationsdata, hypotetiske data og dataindsamling via surveys, eksperimentelle data og realtidsdata. Kurset omhandler også governance f.eks. databehandlingsplaner, GDPR og FAIR. I kurset skal de studerende løbende afprøve de forskellige værktøjer på forskellige datasæt, så de kan opbygge en forståelse af de udfordringer, der følger med databehandling (og hvor tidskrævende det er). Den sidste del af kurset omhandler dataanalyse og indeholder emner som deskriptiv statistik, visualisering, mapmatching, samt regressions og klassifikationsmodeller.
Sidst opdateret
18. november, 2022