02451 Introduktion til machine learning

2025/2026

Kursusinformation
Introduction to Machine Learning
Engelsk
5
Bachelor
Kurset udbydes som enkeltfag
F4A (tirs 13-17)
Campus Lyngby
Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Python.
13-uger
Eksamen afholdes på en særlig dag: klik på Eksamensplacering til venstre for at se dato
Skriftlig eksamen og bedømmelse af opgave(r)
Godkendelse af opgaver er en forudsætning for at bestå kurset.
Skriftlig eksamen: 4 timer
Ingen hjælpemidler :

Multiple choice.
Ingen elektroniske hjælpemidler (f.eks. lommeregnere)
Kun tilladt at medbringe to A4-ark håndskrevne noter.

7-trins skala , ekstern censur
02450
02450/02452
(01001/01002/01003/01004/01005).­(02402/02403).­(02002/02101/02102/02525/02631/02632/02633/02692) , Grundkursus i lineær algebra og matematisk analyse, kendskab til sandsynlighedsregning eller statistik, kendskab til Python.
Morten Mørup , Tlf. (+45) 4525 3900 , mmor@dtu.dk
Bjørn Sand Jensen (Primær kontaktperson) , bjje@dtu.dk
Georgios Arvanitidis , Lyngby Campus, Bygning 321, Tlf. (+45) 4525 5241 , gear@dtu.dk
01 Institut for Matematik og Computer Science
http://www.compute.dtu.dk/courses/02450
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At give deltagerne kendskab til:
* en generel struktur til datamodellering
* en række grundlæggende og bredt anvendte machine learning metoder
* Python som værktøj til dataanalyse, datamodellering, og machine learning
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Forklare de vigtigste trin der er involveret i datamodellering fra forberedelse af data, modellering af data til evaluering og formidling af resultaterne.
  • Diskutere centrale machine learning begreber som featureudtrækning, kryds-validering, generalisering og overindlæring, prædiktion, curse of dimensionality og bias-varians tradeoff.
  • Matche praktiske problemer til standard datamodelleringsproblemer såsom dimensionalitetsreduktion, regression, klassifikation, tæthedsestimering og gruppering (clustering).
  • Forklare hvordan relevante machine learning metoder virker.
  • Beskrive forudsætninger, begrænsninger og styrker af relevante machine learning metoder.
  • Anvende, modificere, og implementere centrale aspekter af machine learning algoritmer i Python.
  • Anvende visualiseringsteknikker og statistik til at evaluere modelpræstationer, identificere mønstre og problemer med data.
  • Udvælge, kombinere og modificere datamodelleringsmetoder for at analysere data og formidle resultaterne af analysen.
Kursusindhold
Struktureret datamodellering.
Dataforbedredelse og featureudtrækning.
Beskrivende statistikker.
Similaritetsmål.
Kostfunktioner (inkl. maximum likelihood).
Optimeringsmetoder til machine learning.
Overindlæring, generalisering, regualisering og bias-varians afvejninger.
Krydsvalidering.
Statistisk evaluering og sammenligning af machine learning modeller.
Visualisering og fortolkning af modeller.
Dimensionalitetsreduktion (inkl. principal komponent analyse).
Klassifikationsmetoder (beslutningstræer, logistisk og multinomial regression, nærmeste nabo, naiv Bayes, feed forward neurale netværk og ensemblemetoder)
Regressionsmetoder (regressionstræer, lineær regression, nærmeste nabo, feed forward neurale netværk og ensemblemetoder)
Gruppering (k-means, hierarkisk gruppering og miksturmodeller).
Tæthedsestimering (kernel baseret tæthedsestimering, Gaussiske miksturmodeller, og EM-algoritmen)
Anomali/​outlier-detektion (inkl. tæthedsbaserede metoder).
Litteraturhenvisninger
Kursusnoter
Bemærkninger
Kurset er et grundlæggende machine learning kursus som er relevant for alle bachelorretninger.
Sidst opdateret
28. juli, 2025