02476 Machine Learning Operations

2025/2026

Kursusinformation
Machine Learning Operations
Engelsk
5
Kandidat
Kurset udbydes som enkeltfag
Januar
Campus Lyngby
Kurset inkluderer forelæsninger, øvelser og projektarbejde. Forelæsningerne er korte og er ment til at give kontekst hvorfor hvert emne er vigtigt. Hovedfokus er øvelserne med vægt på praktiske værktøjer og kode praksis for at implementere maskine læringsmodeller i produktion. Omkring 30% af kurset bliver brugt på projektarbejde i grupper på 3-5 personer, hvor værktøjer gennemgået i kurset skal anvendes på et selvvalgt maskinelærings problem.
3-uger
Sidste dag(e) i 3-ugersperioden
Bedømmelse af opgave(r)/rapport(er)
Alle hjælpemidler - med adgang til internettet
bestået/ikke bestået , ekstern censur
02456 , General forståelse for maskinlæring (datasets, sandsynlighedsregning, klassifikationsmodeller, overfitting etc.) og grundlæggende erfaring med dyb læring (backpropagation, convolutional neural networks, auto-encoders etc.). Kendskab til kodning i Pytorch
Nicki Skafte Detlefsen , Lyngby Campus, Bygning 321 , nsde@dtu.dk
Søren Hauberg , Tlf. (+45) 4525 3899 , sohau@dtu.dk
01 Institut for Matematik og Computer Science
https://skaftenicki.github.io/dtu_mlops/
I studieplanlæggeren
Et EuroTeQ virtuel mobilitetskursus
Overordnede kursusmål
Introducere den studerende til multiple programmeringsværktøjer og praksisser for softwareudvikling for organisering, skalering, deployment og monitorering af maskinlærings modeller til forskning og produktion. Fokus er på hands-on erfaring med en række frameworks, lokalt og i cloud miljøer, til at arbejde med storskala maskinlærings systemer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Organisere kode effektivt for at gøre det nemmere at vedligeholde og dele
  • være i stand til at bruge versionsstyring til at samarbejde effektivt om kodeudvikling og håndtering af store mængder data
  • være i stand til at lave reproducerbare softwaremiljøer og reproducerbare containerized applikationer og eksperimenter
  • være i stand til at fejlfinde, profilere, visualisere og overvåge multiple eksperimenter for at vurdere model performance
  • implementere basale tests af software og bruge continuous integration (CI) til at automatisere kode udvikling
  • være i stand til at bruge online cloud baserede computing services for at skalere eksperimenter og automatisere processer
  • deploy maskine læringsmodeller, både lokalt og i cloud og monitorere modellens livscyklus efter implementering
  • demonstrere hvordan man skalerer dataindlæsning, træning og inferens af maskinlæringspipelinen ved hjælp af distribuerede metoder og optimeringsstrategier
  • foretage et mindre forskningsprojekt i samarbejde med ens medstuderende hvor der anvendes de værktøjer man har lært i kurset
Kursusindhold
Kode miljøer, kode organisering, god kodningspraksis, kode og data versionsstyring, reproducerbare og containerized miljøer, reproducerbare eksperimenter, kode fejlfinding tools, kode profilering, storskala experiment logging og monitoring, unit testing, continuous integration, continuous maskinlæring, cloud infrastruktur, cloud baseret maskinlæring, distribueret data loading og træning, optimeringsmetoder for inferens, lokal og cloud baseret deployment, monitorering af deployed applikation
Sidst opdateret
02. maj, 2025