Overordnede kursusmål
At give deltagerne kendskab til:
* en række grundlæggende og bredt anvendte metoder til data
modellering v.h.a. machine learning,
* en generel struktur til datamodellering,
* Matlab, R eller Python som værktøj til dataanalyse (deltagerne
kan frit vælge mellem disse programmeringssprog).
Kurset sætter således deltagerne i stand til at benytte machine
learning til modellering af real-world data.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Beskrive de vigtigste trin der er involveret i datamodellering
fra forberedelse af data, modellering af data til evaluering og
formidling af resultaterne.
- Diskutere centrale machine learning begreber som
featureudtrækning, kryds-validering, generalisering og
overindlæring, prædiktion og curse of dimensionality.
- Skitsere hvordan datamodelleringsmetoder virker og beskrive
deres forudsætninger og begrænsninger.
- Matche praktiske problemer til standard
datamodelleringsproblemer såsom regression, klassifikation,
tæthedsestimering, gruppering (clustering) og association
mining.
- Anvende struktureret datamodellering indenfor en bred vifte af
anvendelsesområder såsom medicoteknik, bio-informatik, kemi,
elektronik og computer science.
- Beregne resultaterne af datamodelleringen ved brug af Matlab, R
eller Python.
- Bruge visualiseringsteknikker og statistik til at evaluere
modelpræstationer, identificere mønstre og problemer med data.
- Kombinere og modificere datamodelleringsværktøjer med henblik
på at analysere eget datasæt samt formidle resultaterne af
analysen.
Kursusindhold
Struktureret datamodellering. Dataforbedredelse. Featureudtrækning
og dimensionalitetsreduktion, herunder principal komponent analyse.
Similaritetsmål og beskrivende statistikker. Visualisering og
fortolkning af modeller. Overindlæring og generalisering.
Klassifikation (beslutningstræer, nærmeste nabo, naiv Bayes,
neurale netværk og ensemblemetoder). Lineær regression. Gruppering
(k-means, hierarkisk gruppering og mixturmodeller).
Associeringsregler. Tæthedsestimering og outlierdetektion.
Anvendelser indenfor et bredt spektrum af ingeniørvidenskab.
Litteraturhenvisninger
Kursusnoter
Bemærkninger
Kurset er et grundlæggende machine learning kursus som er relevant
for alle tekniske diplom-, bachelor- og masterretninger. Kurset
giver en indføring i grundlæggende machine learning, matematikken
bag metoderne samt hands-on erfaring i metodernes anvendelser.
Kurset kan således stå alene.
Sidst opdateret
20. januar, 2017