Overordnede kursusmål
At give deltagerne en grundlæggende indsigt i:
• Basale data science-koncepter og udvalgte metoder
• Kommunikation af data science-analyser
• Projektarbejde i grupper i forbindelse med data science
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forklare data science-processerne i PPDAC-cyklen
- Vælge egnet data til at analysere et selvvalgt samfundsrelevant
emne
- Kommunikere data science-analyser til et ikke-teknisk publikum
i en mundtlig præsentation med hensigtsmæssigt designede
datavisualiseringer
- Give relevant peerfeedback baseret på prædefinerede kriterier
og benytte feedback til konstruktivt at forbedre en data
science-analyse
- Beskrive og reflektere over egen rolle i et projektbaseret
gruppearbejde
- Anvende basale data science-metoder i Python og vurdere deres
egnethed for et givent problem og datasæt
- Argumentere for valg af variable og deres form i en multipel
regressionsmodel baseret på statistiske mål og visualiseringer
- Udføre relevante scenarieanalyser baseret på modelprædiktioner
i Python og fortolke resultaterne med henblik på at kvalificere den
offentlige debat af en samfundsmæssig problemstilling
- Skrive en sammenhængende rapport der syntetiserer en data
science-analyse og dens begrænsninger på en velstruktureret
måde
Kursusindhold
Kurset er en introduktion til data science med det formål at
udvikle de studerendes forståelse for, hvad det vil sige at arbejde
med data science i en samfundsmæssig kontekst. Kurset introducerer
forskellige typer af basale data science-metoder (multipel lineær
regression, logistisk regression og cluster-analyse), men sigter
også efter at give de studerende mulighed for at erhverve sig
relevante generiske ingeniørkompetencer såsom at arbejde i en
gruppe og kommunikere resultater skriftligt såvel som mundtligt.
Derudover vil kurset også berøre hvordan ingeniører i praksis
arbejder med data science, så de studerende opnår en forståelse af
samfundsmæssige anvendelser af data science udenfor universitetet.
Kurset består af en blanding af projektarbejde og interaktive
klassesessioner. Klassesessionerne baseres på aktiv læring med
maksimal fokus på hands-on erfaring og diskussioner. De studerende
har allokeret tid til at arbejde med deres projekter i løbet af
sessionerne, men selvstændigt viderearbejde med projekterne mellem
kursusgangene forventes.
Litteraturhenvisninger
Kurset gør brug af udvalgte dele af følgende:
- James, Witten, Hastie, Tibshirani, Taylor (2023) An Introduction
to Statistical Learning: with Applications in Python.
https://findit.dtu.dk/en/catalog/64f4119c68cc5422d030e2e9.
- Wilke (2019). Fundamentals of data visualization: a primer on
making informative and compelling figures. O'Reilly Media.
https://clauswilke.com/dataviz/.
Yderligere materiale stilles til rådighed i løbet af kurset.
Bemærkninger
Kurset er et indledende obligatorisk element af bacheloruddannelsen
Data Science og Management. Kurset er forbeholdt studerende på
bacheloruddannelsen Data Science og Management.
Sidst opdateret
18. august, 2025