22062 Introduktion til medicinsk datavidenskab

2025/2026

Bachelorstuderende på Medicin og Teknologi har første prioritet.
Kursusinformation
Introduction to Medical Data Science
Engelsk
5
Bachelor
E4A (tirs 13-17)
Campus Lyngby
Forelæsninger samt øvelser
13-uger
E4A, F4A
Skriftlig eksamen
Eksamen vil benytte multiple choice questions (MCQ).
Skriftlig eksamen: 4 timer
Alle hjælpemidler - uden adgang til internettet
7-trins skala , intern bedømmelse
010010100201035.­(02002/02003).­0240222050 , Det anbefales at tage 22051 samtidigt. Det antages, at man allerede behersker Python programmering på et niveau svarende til kursus 02002.
Minimum 10 Maksimum: 100
Nicolai Spicher , nicsp@dtu.dk
Andreas Brink-Kjær , andbri@dtu.dk
22 Institut for Sundhedsteknologi
I studieplanlæggeren
Overordnede kursusmål
Målet med kurset er at sætte dig i stand til at behandle medicinske data fra det virkelige liv ved hjælp af signalbehandling og maskinlæringsteknikker. Der vil blive lagt vægt på praktisk behandling af data, der er indsamlet i forbindelse med patientpleje, såsom tabeldata fra elektroniske patientjournaler, medicinske signaler og billeder. Desuden introduceres udfordringer, der opstår, når man arbejder med medicinske data, såsom manglende data, ulige fordeling af klasser, forskydninger af fordelinger mellem datasæt, bias, og artefakter, samt værktøjer til at modarbejde disse udfordringer.
Dette kursus vil udbygge dine færdigheder i programmering med Python og introducere dig til nye biblioteker. Du vil lære ”Best Practice” i anvendelsen af relevante datastrukturer, distribueret versionskontrol osv. Du vil udvikle evnen til kritisk at vurdere datakvalitet og model præstation gennem validerings-, fortolknings- og forklaringsteknikker.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Diskutere de karakteristiske egenskaber ved medicinske data, de forskellige sammenhænge som de genereres i, og de udfordringer man støder på, når man behandler dem.
  • Anvende relevante medicinske dataformater (f.eks. EDF, DICOM) og argumentere for de bedst egnede datastrukturer, når du behandler dem.
  • Forklare og eksemplificere, hvordan dataegenskaber begrænser valget af databehandlingsmetoder.
  • Skelne mellem forskellige typer artefakter og støj i medicinske data og vurdere deres indvirkning på analysen.
  • Anvende visualiseringsteknikker til at få indsigt i medicinske datasæt og til at identificere potentielle udfordringer i data, f.eks. bias.
  • Diskutere, forklare og implementere løsninger til medicinske dataanalyse-opgaver ved hjælp af signalbehandling og maskinlæring.
  • Implementere egne algoritme pakker i Python ved hjælp af relevante biblioteker inden for medicinsk datavidenskab og i overensstemmelse med god programmeringspraksis.
  • Generere syntetiske datasæt for at benchmarke kapaciteten af algoritme-pipelines og ”black box”-metoder.
  • Vælge rimelige præstationsmål til evaluering af medicinske databehandlingsopgaver og udlede forbedringer baseret på dem.
  • Foretage en kritisk vurdering af datadrevne modeller med hensyn til fortolkning, bias og generaliserbarhed i en klinisk kontekst.
  • Formidle indsigt og resultater fra et medicinsk dataanalyseprojekt klart og effektivt.
  • Give eksempler på brug af medicinsk datavidenskab i præ-/klinisk praksis og forskning.
Kursusindhold
Dette kursus introducerer kernemetoder inden for medicinsk datavidenskab med fokus på praktisk analyse af sundhedsdata fra den virkelige verden efter god programmeringspraksis. De studerende vil arbejde med elektroniske patientjournaler, fysiologiske signaler (f.eks. EKG, EEG) og medicinske billeder (f.eks. røntgenbilleder) for at lære, hvordan man håndterer almindelige udfordringer som støj, ulige fordeling af klasser, og distributionsskift.
Centrale emner omfatter signalbehandling (resampling, filtrering), datavisualisering og maskinlæring (logistisk regression, beslutningstræer, ensemblemodeller, krydsvalidering). Kurset dækker også modelforklaringer og introducerer kliniske anvendelser og dataformater (f.eks. EDF). Disse emner vil blive dækket af seks individuelle programmeringsopgaver.
Bemærkninger
Det forventes, at du medbringer en bærbar computer med et Python-miljø (se https:/​/​pythonsupport.dtu.dk/​). Specialiserede pakker vil blive installeret i løbet af kurset. Det anbefales at kurset tages parallelt med 22051 Signaler og linære systemer i diskret tid. Er du interesseret i mere datanalyse, kan kurset 02451 Introduktion til machine learning anbefales i det efterfølgende forårssemester.
Sidst opdateret
25. juni, 2025