02582 Computerintensiv dataanalyse

2016/2017

Kursusinformation
Computational Data Analysis
Engelsk
5
Kandidat
Kurset udbydes under tompladsordningen
F2B (tors 8-12)
Campus Lyngby
Tretten uger med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger. Desuden udføres to cases som skal bestås for at gå til eksamen.
13-uger
F2B
Mundtlig eksamen og bedømmelse af opgave(r)
Mundtlig eksamen med udgangspunkt i både øvelser, cases og forelæsninger. To cases skal bestås for at gå til eksamen.
Skriftlige hjælpemidler er tilladt
7-trins skala , intern bedømmelse
02581
02409/02450/27411 , Det er tilstrækkeligt med et af ovenstående kurser. Alternativt et lignende kursus i videregående statistik eller dataanalyse. Kendskab til Matlab er en fordel.
Bjarne Kjær Ersbøll , Lyngby Campus, Bygning 324, Tlf. (+45) 4525 3413 , bker@dtu.dk

01 Institut for Matematik og Computer Science
http://www.imm.dtu.dk/courses/02582
I studieplanlæggeren
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer, hyper-spektrale billeder mv.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Evaluere cluster metoder og vælge passende parametre og metoder for givne data
  • Evaluere lineær diskriminant analyse og ridge regression
  • Evaluere og anvende krydsvalidering, bootstrapping og koncepter som overfitting.
  • Evaluere sparse regressions- og klassifikationsmodeller.
  • Evaluere logistisk regression og support vector klassifikation for 2-klasse problemer
  • Evaluere og fortolke Classification and Regression Trees (CART)
  • Evaluere bagging, boosting og random forests for klassifikation og regression.
  • Evaluere og fortolke sparse latente metoder som sparse principale komponenter og sparse partial least squares.
  • Evaluere forskellige usuperviserede dekompositions metoder
  • Sammenligne gennemgåede metoder
Kursusindhold
Methods: Clustering, ridge regression, elastic net, sparse principale komponenter, sparse diskriminant analyse og Gaussian mixture analyse, logistisk regression, support vector machine, classification and regression trees, begging, boosting, random forests, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis.
Case studies: multispektrale billeder, mm.
Sidst opdateret
23. maj, 2017