Overordnede kursusmål
At give deltagerne en grundlæggende indsigt i
• Basale data science-koncepter og udvalgte metoder
• Kommunikation af data science-analyser
• Projektarbejde i grupper i forbindelse med data science
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forklare data science-processerne i PPDAC-cyklen
- Identificere forskellige typer af dataassociationer og beregne
relateret deskriptiv statistik
- Indsamle relevant data til at besvare et givent samfundsmæssigt
problem
- Kommunikere data science-analyser til en ikke-teknisk målgruppe
i en mundtlig præsentation indeholdende hensigtsmæssigt designede
datavisualiseringer
- Give konstruktiv og meningsfuld peerfeedback baseret på
prædefinerede kriterier
- Beskrive og reflektere over egen rolle i et projektbaseret
gruppearbejde
- Anvende basale data science-metoder og vurdere deres relevans
for et givent problem og datasæt
- Udføre prædiktioner og analyser af data i Python og fortolke
resultaterne med henblik på at kvalificere den offentlige debat af
en samfundsmæssig problemstilling
- Skrive en sammenhængende rapport der syntetiserer en data
science-analyse og dens begrænsninger på en velstruktureret måde
inden for et samfundsrelevant emne
Kursusindhold
Kurset er en introduktion til data science med det formål at
udvikle de studerendes forståelse for hvad det vil sige at arbejde
med data science i en samfundsmæssig kontekst. Kurset introducerer
forskellige typer af data science-metoder (lineær regression,
klassifikation, unsupervised learning), men sigter også efter at
give de studerende mulighed for at erhverve sig relevante generiske
ingeniørkompetencer såsom at arbejde i en gruppe og kommunikere
resultater skriftligt så vel som mundtligt. Derudover vil kurset
også berøre hvordan ingeniører i praksis arbejder med data science,
så de studerende opnår en forståelse af samfundsmæssige anvendelser
af data science udenfor universitetet.
Kurset består af en blanding af projektarbejde og interaktive
klassesessioner. Klassesessionerne vil tilskynde aktiv læring med
maksimal fokus på hands-on erfaring og diskussioner. De studerende
har også allokeret tid til at arbejde med deres projekter i løbet
af sessionerne.
Litteraturhenvisninger
Kurset gør brug af følgende:
- James, Witten, Hastie, Tibshirani, Taylor (2023) An Introduction
to Statistical Learning: with Applications in Python.
https://findit.dtu.dk/en/catalog/64f4119c68cc5422d030e2e9.
- Wilke (2019). Fundamentals of data visualization: a primer on
making informative and compelling figures. O'Reilly Media.
https://clauswilke.com/dataviz/.
Yderligere materiale stilles til rådighed i løbet af kurset.
Bemærkninger
Kurset er et indledende obligatorisk element af bacheloruddannelsen
Data Science og Management. Kurset er forbeholdt studerende på
bacheloruddannelsen Data Science og Management.
Sidst opdateret
02. maj, 2024