2008/2009

02581 Computerintensiv Dataanalyse

Engelsk titel: 


Computational Data Analysis

Sprog:


Point (ECTS )

  10

Kursustype:   

Civil- Videregående Kursus
Kurset udbydes under åben uddannelse


Skemaplacering:

F4

 

Undervisningsform:

7 uger med forelæsninger og databarøvelser, samt 6 uger med mere omfattende øvelser i billedanalyse, anvendt statistik og multimedieanalyse. Aktiviteterne veksler mellem øvelser og forelæsninger.

Kursets varighed:

13-uger

Eksamensplacering:

Særlig dag,   E4B  22.5.2008

Evalueringsform:

Hjælpemidler:

Bedømmelsesform:

Faglige forudsætninger:

,

Overordnede kursusmål:

At bibringe studenten et overblik over anvendelse af computerintensive dataanalyse begreber og metoder samt giver baggrund for valg af Informatikspecialisering.


Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Opsummere og anvende multipel lineær regressionsteknikker.
  • Anvende og fortolke ridge regressionsteknikker.
  • Opsummere og anvende bias-varians trade-off, prædiktionsfejl og krydsvalidering
  • Anvende og fortolke metoder til Bayesiansk inferens
  • Opsummere og anvende lineær diskriminantanalyse
  • Opsummere og anvende logistisk regression og support vector klassifikation for 2-klasse problemer
  • Opsummere og anvende naturlige kubiske splines og thin plate splines
  • Anvende og fortolke smoothing splines og metoder til automatisk valg af smoothing parameter
  • Identificere og beskrive metoder som MARS og PRIM.
  • Anvende og fortolke Generaliserede Additive Modeller (GAM) og Klassifikations- og regressionstræer (CART).
  • Opsummere og anvende k-means clustering og EM-algoritmen til Gaussianske mixtures
  • Anvende og fortolke principal komponentanalyse og ICA

Kursusindhold:

Metoder: Bayes optimale beslutninger, generalisationsbegrebet, likelihood begrebet, modelvalg, lineær klassifikationsmetoder, natural kubisk splines, smoothing splines, thin plate splines, additive modeller og beslutningstræer, klyngeanalyse, principal komponent analyse, ICA. Case studier: medicinsk billedanalyse, industriel computervision, miljømodeller, biostatistik, tonedetektion, mønstergenkendelse i multimedier.


Bemærkninger:

Dette kursus giver via en række praktiske eksempler den nødvendige baggrund for specialiseringer indenfor signal- og billedanalyse og anvendt statistik.


Kursusansvarlig:

Ole Winther, 321, 115, (+45) 4525 3895, owi@imm.dtu.dk  
Rasmus Larsen, 321, 220, (+45) 4525 3415, rl@imm.dtu.dk  
Murat Kulahci, 305, 111, (+45) 4525 3382, mk@imm.dtu.dk  

Institut:

02 Institut for Informatik og Matematisk Modellering

Kursushjemmeside:

http://www.imm.dtu.dk/courses/02581

Nøgleord:

datamining, klassifikation, Bayes beslutninger, lineære modeller, dynamiske systemer
Sidst opdateret: 9. juni, 2008