2009/2010

02582 Computerintensiv Dataanalyse

Engelsk titel: 


Computational Data Analysis

Sprog:


Point (ECTS )

  5

Kursustype:   

Civil- Videregående Kursus
Kurset udbydes under åben uddannelse


Skemaplacering:

F4A

 

Undervisningsform:

Tretten uger med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger.

Kursets varighed:

13-uger

Eksamensplacering:

E4A 

Evalueringsform:

Hjælpemidler:

Bedømmelsesform:

Pointspærring:

Faglige forudsætninger:

,

Overordnede kursusmål:

At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer, hyper-spektrale billeder mv.


Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Opsummere og anvende spektral unmixing med og uden library.
  • Anvende endmember finding for spektrale data.
  • Opsummere og anvende krydsvalidering og forklare koncepter som overfitting.
  • Opsummere og anvende sparse regressions- og klassifikationsmodeller. Bayesiansk inferens
  • Opsummere og anvende logistisk regression og support vector klassifikation for 2-klasse problemer
  • Anvende og fortolke Classification and Regression Trees (CART)
  • Anvende random forests for klassifikation og regression.
  • Anvende og fortolke sparse latente metoder som sparse principale komponenter og sparse partial least squares.
  • Anvende og fortolke multiway models

Kursusindhold:

Methods: Spektral unmixing, endmember finding, elastic net, sparse principale komponenter, sparse partial least squares, sparse diskriminant analyse og Gaussian mixtur analyse, logistisk regression, support vector machine, classification and regression trees, random forests.


Bemærkninger:

Elitestuderende under MMC-masteren, samt PhD-studerende har mulighed for yderligere specialisering ved sideløbende at tage kursus 02583.


Kursusansvarlig:

Line Katrine Harder Clemmensen, 305, 123, (+45) 4525 3764, lhc@imm.dtu.dk  

Institut:

02 Institut for Informatik og Matematisk Modellering

Kursushjemmeside:

http://www.imm.dtu.dk/courses/02582

Nøgleord:

Support vector machines, elastic net, sparse metoder, random forests, decompositions for unsupervised learning
Sidst opdateret: 2. september, 2010