02988 AI-alignment, sikkerhed og tryghed: Anvendelser inden for mental sundhed og menneskecentrerede systemer

2025/2026

Kursusinformation
AI Alignment, safety and security: Applications in Mental Health and Human-Centered Systems
Engelsk
2,5
Ph.d., Fagligt fokuseret kursus
Kurset udbydes som enkeltfag
20.01.2026-23.01.2026
La Officina/KU; TBC
Daglige forelæsninger efterfulgt af øvelser og paneldiskussioner. Deltagerne vil deltage i både individuelle og gruppebaserede læringsaktiviteter, herunder: a) Gruppebaserede projekter relevante for deres ph.d.-forskningsemner; b) Præsentation af projektresultater for fagfæller og undervisere; c) Posterdesign og præsentation ved den dedikerede postersession. Deltagerne vil indsende projektrapporter og posterpræsentationer, som evalueringen vil være baseret på.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser
Afløsningsopgave
Alle hjælpemidler - med adgang til internettet
bestået/ikke bestået , intern bedømmelse
02450 anbefales, men er ikke obligatorisk
Minimum 5 Maksimum: 40
Sneha Das , Lyngby Campus, Bygning 321 , sned@dtu.dk
Nicole Nadine Lønfeldt , nicole.nadine.loenfeldt@regionh.dk
Line Katrine Harder Clemmensen , Lyngby Campus, Bygning 321 , lkhc@dtu.dk
01 Institut for Matematik og Computer Science
Københavns Universitat
Region Hovedstadens psykiatriske hospital
https://sites.google.com/view/a2s2...en-2026/welcome
I studieplanlæggeren
05.01.2026
At the Studyplanner:

- DTU PhD students must register for this course through the Study Planner.

- PhD student from other universities must register as a guest student through:
https:/​/​www.dtu.dk/​english/​education/​phd/​intro/​guest-phd/​guest_courses/​registration_form

- Industry employees must register through Learn for Life: https:/​/​lifelonglearning.dtu.dk/​en/​
Overordnede kursusmål
Kurset uddanner forskere i starten af ​​karrieren i AI-sikkerhed med anvendelser inden for mental sundhed og menneskecentrerede applikationer. Det vil tilbyde en teknisk funderet udforskning af AI-tilpasning og -sikkerhed, der bevæger sig ud over skadeforebyggelse og hen imod systemer, der udviser kontekstbevidsthed, robusthed og (menneskelige, samfundsmæssige) værdier. Ved at bruge mental sundhed som et motiverende domæne introducerer det metoder og evalueringsrammer til at opbygge tilpassede, troværdige og menneskecentrerede AI-systemer, der kan anvendes på andre områder med høj indsats. Der lægges vægt på kritisk og teknisk refleksion, der forbinder fremskridt inden for alignment-forskning med spørgsmålet om, hvordan AI-systemer kan fungere passende, transparent og ansvarligt i menneskelige kontekster.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • 1. Forstå de teoretiske og praktiske grundlag for AI-tilpasning og -sikkerhed.
  • 2. Formaliser tilpasningsmål og implementer dem i rammer.
  • 3. Anvend og sammenlign evalueringsteknikker for robusthed, bias, usikkerhed og fejltilstande og risici i følsomme applikationer.
  • 4. Undersøg implementeringsovervejelser, herunder kliniker- eller human-in-the-loop-design, overvågning og tilsyn
  • 5. Reflekter kritisk over overgangen fra sikker til fornuftig AI: systemer, der fungerer passende, ikke kun sikkert, i menneskelige og samfundsmæssige kontekster.
  • Analysere fejl- og miskaligneringsmønstre i store sprogmodeller og generative modeller samt forstå, hvordan disse opstår fra træningsdata, mål og sociotekniske sammenhænge.
  • Integrere kvalitative og kvantitative evalueringsmetoder til at vurdere modeladfærd, hensigtsmæssighed og potentielle risici i menneskecentrerede eller mental-sundhedsrelaterede anvendelser.
  • Samarbejde i tværfaglige miljøer, herunder effektivt kommunikere udfordringer og indsigter om alignment på tværs af maskinlæring, psykologi, klinisk praksis og human-computer interaction.
Kursusindhold
Kurset vil bestå af to hoveddele: a) Tekniske fundamenter for AI-tilpasning, sikkerhed og tryghed, og b) Udvikling og evaluering af tilpasset AI til mental sundhed og andre menneskecentrerede applikationer. Vejledende emner inkluderer:
1. Epistemologiske fundamenter for maskinlæring og tilpasningens natur.
2. Sikkerhed, robusthed og tryghed i store sprog- og generative modeller, herunder modstridende adfærd og kontrol.
3. Værditilpasning i data, mål og feedbackdrevet læring.
4. Evalueringsmetoder for pålidelig og mennesketilpasset AI, herunder kvantitative og kvalitative tilgange.
5. Kognitive og samfundsmæssige dimensioner af tilpasning i menneske-AI-interaktion og beslutningstagning.
6. Casestudier fra mental sundhed og assisterende eller beslutningsstøttende systemer.
7. Kliniske, adfærdsmæssige, etiske og filosofiske perspektiver, der forbinder teknisk tilpasning med menneskelig dømmekraft og følsomhed.
Litteraturhenvisninger
Guerraoui, R., Gupta, N., & Pinot, R. (2024). Robust Machine Learning. Springer.
Gabriel, I. (2020). Artificial intelligence, values, and alignment. Minds and machines, 30(3), 411-437.
Sidst opdateret
28. november, 2025