02910 Computerintensiv dataanalyse

2016/2017

Kurset udbydes ikke i 2017. Som alternativ henvises der til kursus 02901.
Kursusinformation
Computational data analysis
Engelsk
5
Ph.d., Servicekursus (faglige færdigheder)
Kurset udbydes under tompladsordningen
August
Kurset udbydes ikke i 2017. Som alternativ henvises der til kursus 02901.
Campus Lyngby
En uge med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser
Bedømmelse af opgave(r)/rapport(er)
Eksamen med udgangspunkt i en rapport skrevet af den studerende.
Skriftlige hjælpemidler er tilladt
bestået/ikke bestået , intern bedømmelse
02582/02582
Det forudsættes at deltagerne har kendskab til statistik eller dataanalyse og kendskab til Matlab.
Bjarne Kjær Ersbøll , Lyngby Campus, Bygning 324, Tlf. (+45) 4525 3413 , bker@dtu.dk

01 Institut for Matematik og Computer Science
http://www.imm.dtu.dk/courses/02910
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer mv.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Relatere dele af kurset til den studerendes eget projekt
  • Evaluere krydsvalidering og koncepter som overfitting
  • Evaluere og anvende sparse regressions og klassifikations modeller
  • Evaluere og anvende logistisk regression og support vector machines
  • Evaluere og anvende klassifikations og regressions træer (CART)
  • Evaluere og anvende random forests
  • Evaluere og fortolke sparse latente modeller som sparse principal component analysis
  • Evaluere og fortolke en række af ikke-superviserede dekompositions modeller
  • Evaluere og anvende multiway (tensor) modeller
  • Evaluere cluster modeller
Kursusindhold
Methods: Cross-validation, elastic net, sparse principal components, sparse discriminant analysis and Gaussian mixture analysis, logistic regression, support vector machine, classification and regression trees, random forests, clustering, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis, mutliway models.
Sidst opdateret
04. maj, 2017