Overordnede kursusmål
Målet med kurset er at sætte dig i stand til at behandle medicinske
data fra det virkelige liv ved hjælp af signalbehandling og
maskinlæringsteknikker. Der vil blive lagt vægt på praktisk
behandling af data, der er indsamlet i forbindelse med
patientpleje, såsom tabeldata fra elektroniske patientjournaler,
medicinske signaler og billeder. Desuden introduceres udfordringer,
der opstår, når man arbejder med medicinske data, såsom manglende
data, ulige fordeling af klasser, forskydninger af fordelinger
mellem datasæt, bias, og artefakter, samt værktøjer til at
modarbejde disse udfordringer.
Dette kursus vil udbygge dine færdigheder i programmering med
Python og introducere dig til nye biblioteker. Du vil lære ”Best
Practice” i anvendelsen af relevante datastrukturer, distribueret
versionskontrol osv. Du vil udvikle evnen til kritisk at vurdere
datakvalitet og model præstation gennem validerings-, fortolknings-
og forklaringsteknikker.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Diskutere de karakteristiske egenskaber ved medicinske data, de
forskellige sammenhænge som de genereres i, og de udfordringer man
støder på, når man behandler dem.
- Anvende relevante medicinske dataformater (f.eks. EDF, DICOM)
og argumentere for de bedst egnede datastrukturer, når du behandler
dem.
- Forklare og eksemplificere, hvordan dataegenskaber begrænser
valget af databehandlingsmetoder.
- Skelne mellem forskellige typer artefakter og støj i medicinske
data og vurdere deres indvirkning på analysen.
- Anvende visualiseringsteknikker til at få indsigt i medicinske
datasæt og til at identificere potentielle udfordringer i data,
f.eks. bias.
- Diskutere, forklare og implementere løsninger til medicinske
dataanalyse-opgaver ved hjælp af signalbehandling og
maskinlæring.
- Implementere egne algoritme pakker i Python ved hjælp af
relevante biblioteker inden for medicinsk datavidenskab og i
overensstemmelse med god programmeringspraksis.
- Generere syntetiske datasæt for at benchmarke kapaciteten af
algoritme-pipelines og ”black box”-metoder.
- Vælge rimelige præstationsmål til evaluering af medicinske
databehandlingsopgaver og udlede forbedringer baseret på dem.
- Foretage en kritisk vurdering af datadrevne modeller med hensyn
til fortolkning, bias og generaliserbarhed i en klinisk
kontekst.
- Formidle indsigt og resultater fra et medicinsk
dataanalyseprojekt klart og effektivt.
- Give eksempler på brug af medicinsk datavidenskab i
præ-/klinisk praksis og forskning.
Kursusindhold
Dette kursus introducerer kernemetoder inden for medicinsk
datavidenskab med fokus på praktisk analyse af sundhedsdata fra den
virkelige verden efter god programmeringspraksis. De studerende vil
arbejde med elektroniske patientjournaler, fysiologiske signaler
(f.eks. EKG, EEG) og medicinske billeder (f.eks. røntgenbilleder)
for at lære, hvordan man håndterer almindelige udfordringer som
støj, ulige fordeling af klasser, og distributionsskift.
Centrale emner omfatter signalbehandling (resampling, filtrering),
datavisualisering og maskinlæring (logistisk regression,
beslutningstræer, ensemblemodeller, krydsvalidering). Kurset dækker
også modelforklaringer og introducerer kliniske anvendelser og
dataformater (f.eks. EDF). Disse emner vil blive dækket af seks
individuelle programmeringsopgaver.
Bemærkninger
Det forventes, at du medbringer en bærbar computer med et
Python-miljø (se
https://pythonsupport.dtu.dk/).
Specialiserede pakker vil blive installeret i løbet af kurset. Det
anbefales at kurset tages parallelt med 22051 Signaler og linære
systemer i diskret tid. Er du interesseret i mere datanalyse, kan
kurset 02451 Introduktion til machine learning anbefales i det
efterfølgende forårssemester.
Sidst opdateret
25. juni, 2025