02910 Applied computerintensiv dataanalyse

2023/2024

Kurset udbydes ikke i 2024.
Kursusinformation
Applied computational data analysis
Engelsk
5
Ph.d., Servicekursus (faglige færdigheder)
Kurset udbydes som enkeltfag
August
Kurset afholdes ikke i 2024.
Campus Lyngby
Campus og online
En uges undervisning med øvelser. Undervisningen gives som flipped classroom med video forelæsninger og Q&A sessioner samt diskussioner om egen data og projekter ifh det lærte. Der er desuden øvelser til alle forelæsningsemnerne der giver hands-on erfaring med metoderne. Deltagerne arbejder med et projekt med deltagernes egne data og afleverer en rapport baseret på disse efter en måned. Det er altså forventet at den studerende arbejder med projektet efter undervisningsugen.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser
Bedømmelse af opgave(r)/rapport(er)
Eksamen med udgangspunkt i en rapport skrevet af den studerende. Denne rapport er baseret på den PhD studerendes egne data og anvender og analyserer metoder fra kurset med henblik på egne data.
Skriftlige hjælpemidler er tilladt
bestået/ikke bestået , intern bedømmelse
02582/02582
Det forudsættes at deltagerne har kendskab til statistik eller dataanalyse og kendskab til Matlab, python eller R.
Minimum 8 Maksimum: 60
Line Katrine Harder Clemmensen , Lyngby Campus, Bygning 321 , lkhc@dtu.dk
01 Institut for Matematik og Computer Science
http://www.imm.dtu.dk/courses/02910
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. At anvende metoderne på en problemstilling med egne dat.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Relatere dele af kurset til den studerendes eget projekt
  • Evaluere krydsvalidering og koncepter som overfitting
  • Evaluere og anvende sparse regressions og klassifikations modeller
  • Evaluere og anvende logistisk regression og support vector machines
  • Evaluere og anvende klassifikations og regressions træer (CART)
  • Evaluere og anvende random forests, boosting og ensemble metoder
  • Evaluere og fortolke sparse latente modeller som sparse principal component analysis
  • Evaluere og fortolke en række af ikke-superviserede dekompositions modeller
  • Evaluere cluster modeller
  • Sammenligne og vælge mellem metoderne ovenfor
Kursusindhold
Methods: Cross-validation, elastic net, sparse principal components, sparse discriminant analysis and Gaussian mixture analysis, logistic regression, support vector machine, classification and regression trees, random forests, clustering, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis.
Sidst opdateret
16. april, 2024