2011/2012

02582 Computerintensiv dataanalyse

Engelsk titel: 


Computational Data Analysis

Sprog:


Point (ECTS )


5

Kursustype:   

Civil- Videregående Kursus
Kurset udbydes under åben uddannelse


Skemaplacering:

F4A

 

Undervisningsform:

Tretten uger med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger. Desuden udføres et mindre projekt, og de studerende præsenterer deres projekter for hinanden den sidste kursusuge.

Kursets varighed:

13-uger

Eksamensplacering:

F4A 

Evalueringsform:

Hjælpemidler:

Bedømmelsesform:

Pointspærring:

Faglige forudsætninger:

,

Overordnede kursusmål:

At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer, hyper-spektrale billeder mv.


Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Evaluere cluster metoder og vælge passende parametre og metoder for givne data
  • Evaluere lineær diskriminant analyse og ridge regression
  • Evaluere og anvende krydsvalidering og koncepter som overfitting.
  • Evaluere sparse regressions- og klassifikationsmodeller. Bayesiansk inferens
  • Evaluere logistisk regression og support vector klassifikation for 2-klasse problemer
  • Evaluere og fortolke Classification and Regression Trees (CART)
  • Evaluere random forests for klassifikation og regression.
  • Evaluere og fortolke sparse latente metoder som sparse principale komponenter og sparse partial least squares.
  • Evaluere forskellige usuperviserede dekompositions metoder
  • Evaluere multiway (tensor) models
  • Evaluere og formidle et relateret emne af eget valg
  • Sammenligne gennemgåede metoder

Kursusindhold:

Methods: Clustering, ridge regression, elastic net, sparse principale komponenter, sparse diskriminant analyse og Gaussian mixture analyse, logistisk regression, support vector machine, classification and regression trees, random forests, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis, mutliway models.
Case studies: multispektrale billeder, mm.


Bemærkninger:

Elitestuderende under MMC-masteren, samt PhD-studerende har mulighed for yderligere specialisering ved sideløbende at tage kursus 02583.


Kursusansvarlig:

Line Katrine Harder Clemmensen, 305, 123, (+45) 4525 3764, lhc@imm.dtu.dk  

Institut:

02 Institut for Informatik og Matematisk Modellering

Kursushjemmeside:

http://www.imm.dtu.dk/courses/02582

Nøgleord:

clustering, sparse regression and classification, unsupervised decompositions, multiway models, classification and regression trees and random forests
Sidst opdateret: 19. april, 2012