02582 Computerintensiv dataanalyse

2021/2022

Kursusinformation
Computational Data Analysis
Engelsk
5
Kandidat
Kurset udbydes som enkeltfag
F2B (tors 8-12)
Campus Lyngby
Tretten uger med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger. Desuden udføres to cases.
13-uger
F2B
Mundtlig eksamen og bedømmelse af opgave(r)
Mundtlig eksamen med udgangspunkt i både øvelser, cases og forelæsninger. Karakteren gives ud fra en helhedsbedømmelse, og det er ikke muligt at bestå uden at en rapport og en poster fra hhv. første og anden case er godkendt.
Skriftlige hjælpemidler er tilladt
7-trins skala , intern bedømmelse
02581
02409/02450/27411 , Det er tilstrækkeligt med et af ovenstående kurser. Alternativt et lignende kursus i videregående statistik eller dataanalyse. Kendskab til Matlab, R eller Python er en fordel.
Minimum 8 Maksimum: 100
Line Katrine Harder Clemmensen , Lyngby Campus, Bygning 324, Tlf. (+45) 4525 3764 , lkhc@dtu.dk
01 Institut for Matematik og Computer Science
http://www.imm.dtu.dk/courses/02582
I studieplanlæggeren
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer, billeder mv.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Evaluere cluster metoder og vælge passende parametre og metoder for givne data
  • Evaluere lineær diskriminant analyse og ridge regression
  • Evaluere og anvende krydsvalidering, bootstrapping og koncepter som overfitting.
  • Evaluere sparse regressions- og klassifikationsmodeller.
  • Evaluere logistisk regression og support vector klassifikation for 2-klasse problemer
  • Evaluere og fortolke Classification and Regression Trees (CART)
  • Evaluere bagging, boosting og random forests for klassifikation og regression.
  • Evaluere og fortolke sparse latente metoder som sparse principale komponenter og sparse partial least squares.
  • Evaluere forskellige usuperviserede dekompositions metoder
  • Sammenligne gennemgåede metoder teoretisk
Kursusindhold
Methods: Clustering, ridge regression, elastic net, sparse principale komponenter, sparse diskriminant analyse og Gaussian mixture analyse, logistisk regression, support vector machine, classification and regression trees, bagging, boosting, random forests, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis.
Case studies: Varies each year.
Sidst opdateret
29. april, 2021