2011/2012

02450 Introduktion til machine learning og datamodellering

Engelsk titel: 


Introduction to Machine Learning and Data Modeling

Sprog:


Point (ECTS )


5

Kursustype:   

Civil- Videregående Kursus
Kurset udbydes under åben uddannelse


Skemaplacering:

E4A og F4A

 

Undervisningsform:

Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Matlab. Øvelserne udføres i hold med 2-3 studerende.

Kursets varighed:

13-uger

Eksamensplacering:

E4A,   F4A 

Evalueringsform:

Eksamens varighed:

Hjælpemidler:

Bedømmelsesform:

Faglige forudsætninger:


Overordnede kursusmål:

At give deltagerne kendskab til:
* en række grundlæggende og bredt anvendte metoder til data modellering v.h.a. machine learning,
* en generel struktur til datamodellering,
* Matlab som værktøj til dataanalyse.

Kurset sætter således deltagerne i stand til at benytte machine learning til modellering af real-world data.


Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Beskrive struktureret datamodellering, herunder: dataforberedelse, featureudtrækning, modellering, visualisering og fortolkning.
  • Forklare et spektrum af machine learning metoder og deres anvendelser indenfor natur, computer og ingeniør-videnskab samt i bio-medicin.
  • Anvende strukturertet datamodellering indenfor et bredt udvalg af problemstillinger i bio-medicin, kemi, elektronik og informatik
  • Forklare centrale machine learning begreber som feature udtrækning, prædiktion, generalisation og visualisering.
  • Designe datamodellering gennem minimering af fejlfunktioner, som for eksempel principal komponent analyse, k-means gruppering, mindste kvadraters metode og nærmeste nabo klassifikation
  • Designe simple, specifikke systemer ved brug af struktureret datamodellering.
  • Beregne resultater med Matlab i struktureret datamodellering.
  • Visualisere og fortolke resultater indenfor struktureret datamodellering.

Kursusindhold:

Struktureret datamodellering. Dataforbedredelse. Featureudtrækning og dimensionalitetsreduktion, herunder principal komponent analyse. Similaritetsmål og beskrivende statistikker. Visualisering og fortolkning af modeller. Overindlæring og generalisering. Klassifikation (beslutningstræer, nærmeste nabo, naiv Bayes, neurale netværk og ensemblemetoder). Lineær regression. Gruppering (k-means, hierarkisk gruppering og mixturmodeller). Associeringsregler. Tæthedsestimering og outlierdetektion. Anvendelser indenfor et bredt spektrum af ingeniørvidenskab.


Litteratur:

Pang-Ning Tan, Michael Steinbach, and Vipin Kumar, "Introduction to Data Mining."


Bemærkninger:

Kurset er et grundlæggende machine learning kursus som er relevant for alle tekniske diplom-, bachelor- og masterretninger. Kurset giver en komplet indføring i grundlæggende machine learning samt hands-on erfaring, og kan således stå alene.


Mulighed for GRØN DYST deltagelse:

Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk/kursustilmelding.aspx


Kursusansvarlig:

Jan Larsen, 321, 113, (+45) 4525 3923, jl@imm.dtu.dk  
Mikkel Nørgaard Schmidt, 321, 132, (+45) 4525 5270, mns@imm.dtu.dk  
Morten Mørup, 321, 118, (+45) 4525 3900, mm@imm.dtu.dk  

Institut:

02 Institut for Informatik og Matematisk Modellering

Kursushjemmeside:

http://www.imm.dtu.dk/courses/02450

Tilmelding:

I CampusNet

Nøgleord:

machine learning, struktureret datamodeling, praktisk ingeniørmæssige anvendelser
Sidst opdateret: 24. februar, 2012