Overordnede kursusmål
At give deltagerne kendskab til:
* en generel struktur til datamodellering
* en række grundlæggende og bredt anvendte machine learning metoder
* Python som værktøj til dataanalyse, datamodellering, og machine
learning
Kurset sætter således deltagerne i stand til at benytte machine
learning til modellering af real-world data.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forklare de vigtigste trin der er involveret i datamodellering
fra forberedelse af data, modellering af data til evaluering og
formidling af resultaterne.
- Diskutere centrale machine learning begreber som
featureudtrækning, kryds-validering, generalisering og
overindlæring, prædiktion, curse of dimensionality og bias-varians
tradeoff.
- Matche praktiske problemer til standard
datamodelleringsproblemer såsom dimensionalitetsreduktion,
regression, klassifikation, tæthedsestimering og gruppering
(clustering).
- Skitsere hvordan relevante machine learning metoder virker samt
beskrive deres forudsætninger, begrænsninger og styrker.
- Anvende og modificere machine learning algoritmer i
Python.
- Anvende visualiseringsteknikker og statistik til at evaluere
modelpræstationer, identificere mønstre og problemer med data.
- Udvælge, kombinere og modificere datamodelleringsmetoder for at
analysere data og formidle resultaterne af analysen.
- Anvende struktureret datamodellering indenfor en bred vifte af
anvendelsesområder såsom medicoteknik, bio-informatik, kemi,
elektronik og computer science.
Kursusindhold
Struktureret datamodellering.
Dataforbedredelse og featureudtrækning.
Beskrivende statistikker.
Similaritetsmål.
Kostfunktioner (inkl. maximum likelihood).
Optimeringsmetoder til machine learning.
Overindlæring, generalisering, regularisering og bias-varians
trade-offs.
Krydsvalidering.
Statistisk evaluering og sammenligning af machine learning
modeller.
Visualisering og fortolkning af modeller.
Dimensionalitetsreduktion (inkl. principal komponent analyse).
Klassifikationsmetoder (beslutningstræer, logistisk og multinomial
regression, nærmeste nabo, naiv Bayes, feed forward neurale netværk
og ensemblemetoder).
Regressionsmetoder (regressionstræer, lineær regression, nærmeste
nabo, feed forward neurale netværk og ensemblemetoder).
Gruppering (k-means, hierarkisk gruppering og miksturmodeller).
Tæthedsestimering (kernel tæthedsestimering, Gaussiske
miksturmodeller, og EM-algoritmen).
Anomali/outlier-detektion (inkl. tæthedsbaserede metoder).
Litteraturhenvisninger
Kursusnoter
Bemærkninger
Kurset er et grundlæggende machine learning kursus som er relevant
for alle masterretninger. Kurset giver en indføring i grundlæggende
machine learning, matematikken bag metoderne samt hands-on erfaring
i metodernes anvendelser. Kurset kan således stå alene.
Sidst opdateret
28. juli, 2025