02910 Computerintensiv dataanalyse

2018/2019

Kurset udbydes 20-24 August i 2018.
Kursusinformation
Computational data analysis
Engelsk
5
Ph.d., Servicekursus (faglige færdigheder)
Kurset udbydes som enkeltfag
August
Kurset udbydes 20-24 August i 2018.
Campus Lyngby
En uge med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger. Derefter et projekt med deltagernes egne data.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser
Bedømmelse af opgave(r)/rapport(er)
Eksamen med udgangspunkt i en rapport skrevet af den studerende.
Skriftlige hjælpemidler er tilladt
bestået/ikke bestået , intern bedømmelse
02582/02582
Det forudsættes at deltagerne har kendskab til statistik eller dataanalyse og kendskab til Matlab.
Line Katrine Harder Clemmensen , Lyngby Campus, Bygning 324, Tlf. (+45) 4525 3764 , lkhc@dtu.dk
Lars Arvastson , larv@lundbeck.com

01 Institut for Matematik og Computer Science
http://www.imm.dtu.dk/courses/02910
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer mv.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Relatere dele af kurset til den studerendes eget projekt
  • Evaluere krydsvalidering og koncepter som overfitting
  • Evaluere og anvende sparse regressions og klassifikations modeller
  • Evaluere og anvende logistisk regression og support vector machines
  • Evaluere og anvende klassifikations og regressions træer (CART)
  • Evaluere og anvende random forests, boosting og ensemble metoder
  • Evaluere og fortolke sparse latente modeller som sparse principal component analysis
  • Evaluere og fortolke en række af ikke-superviserede dekompositions modeller
  • Evaluere cluster modeller
  • Sammenligne og vælge mellem metoderne ovenfor
Kursusindhold
Methods: Cross-validation, elastic net, sparse principal components, sparse discriminant analysis and Gaussian mixture analysis, logistic regression, support vector machine, classification and regression trees, random forests, clustering, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis.
Sidst opdateret
14. maj, 2018