At give deltagerne kendskab til: * en række grundlæggende og bredt anvendte metoder til data modellering v.h.a. machine learning, * en generel struktur til datamodellering, * Matlab som værktøj til dataanalyse.
Kurset sætter således deltagerne i stand til at benytte machine learning til modellering af real-world data.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Beskrive struktureret datamodellering, herunder: dataforberedelse, featureudtrækning, modellering, visualisering og fortolkning.
Forklare et spektrum af machine learning metoder og deres anvendelser indenfor natur, computer og ingeniør-videnskab samt i bio-medicin.
Anvende strukturertet datamodellering indenfor et bredt udvalg af problemstillinger i bio-medicin, kemi, elektronik og informatik
Forklare centrale machine learning begreber som feature udtrækning, prædiktion, generalisation og visualisering.
Designe datamodellering gennem minimering af fejlfunktioner, som for eksempel principal komponent analyse, k-means gruppering, mindste kvadraters metode og nærmeste nabo klassifikation
Designe simple, specifikke systemer ved brug af struktureret datamodellering.
Beregne resultater med Matlab i struktureret datamodellering.
Visualisere og fortolke resultater indenfor struktureret datamodellering.
Kursusindhold:
Struktureret datamodellering. Dataforbedredelse. Featureudtrækning og dimensionalitetsreduktion, herunder principal komponent analyse. Similaritetsmål og beskrivende statistikker. Visualisering og fortolkning af modeller. Overindlæring og generalisering. Klassifikation (beslutningstræer, nærmeste nabo, naiv Bayes, neurale netværk og ensemblemetoder). Lineær regression. Gruppering (k-means, hierarkisk gruppering og mixturmodeller). Associeringsregler. Tæthedsestimering og outlierdetektion. Anvendelser indenfor et bredt spektrum af ingeniørvidenskab.
Litteratur:
Pang-Ning Tan, Michael Steinbach, and Vipin Kumar, "Introduction to Data Mining."
Bemærkninger:
Kurset er et grundlæggende machine learning kursus som er relevant for alle tekniske diplom-, bachelor- og masterretninger. Kurset giver en komplet indføring i grundlæggende machine learning samt hands-on erfaring, og kan således stå alene.
Mulighed for GRØN DYST deltagelse:
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk/kursustilmelding.aspx