02582 Computerintensiv dataanalyse

2024/2025

Kursusinformation
Computational Data Analysis
Engelsk
5
Kandidat
Kurset udbydes som enkeltfag
Generel retningskompetence (MSc), Human-Centered Artificial Intelligence
Generel retningskompetence (MSc), Mathematical Modelling and Computation
Retningsspecifikt kursus (MSc), se flere
Retningsspecifikt kursus (MSc), Bioinformatics and Systems Biology
Retningsspecifikt kursus (MSc), Business Analytics
Retningsspecifikt kursus (MSc), Human-Centered Artificial Intelligence
Retningsspecifikt kursus (MSc), Mathematical Modelling and Computation
Teknologisk specialisering (MSc), se flere
Teknologisk specialisering (MSc), Bioinformatics and Systems Biology
Teknologisk specialisering (MSc), Business Analytics
Teknologisk specialisering (MSc), Human-Centered Artificial Intelligence
Teknologisk specialisering (MSc), Mathematical Modelling and Computation
F2B (tors 8-12)
Campus Lyngby
Tretten uger med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger. Desuden udføres to cases.
13-uger
F2B
Skriftlig eksamen og bedømmelse af opgave(r)
Skriftlig eksamen med udgangspunkt i både lærebog, øvelser og forelæsninger samt to cases med aflevering i semesteret. Karakteren gives ud fra en helhedsbedømmelse.
Skriftlig eksamen: 4 timer
Alle hjælpemidler - uden adgang til internettet :

Lukket internet

7-trins skala , intern bedømmelse
02581
02409/02450/27411 , Det er tilstrækkeligt med et af ovenstående kurser. Alternativt et lignende kursus i videregående statistik eller dataanalyse. Kendskab til Matlab, R eller Python er en fordel.
Minimum 8 Maksimum: 300
Line Katrine Harder Clemmensen , Lyngby Campus, Bygning 321 , lkhc@dtu.dk
Sneha Das , Lyngby Campus, Bygning 321 , sned@dtu.dk
01 Institut for Matematik og Computer Science
http://www.imm.dtu.dk/courses/02582
I studieplanlæggeren
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer, billeder mv. Målet er at give den studerende evnen til analytisk så well som baseret på beregnede resultater at evaluere data anlyse metoder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Evaluere cluster metoder og vælge passende parametre og metoder for givne data
  • Evaluere lineær diskriminant analyse og ridge regression
  • Evaluere og anvende krydsvalidering, bootstrapping og koncepter som overfitting.
  • Evaluere sparse regressions- og klassifikationsmodeller.
  • Evaluere logistisk regression og support vector klassifikation for 2-klasse problemer
  • Evaluere og fortolke Classification and Regression Trees (CART)
  • Evaluere bagging, boosting og random forests for klassifikation og regression.
  • Evaluere og fortolke sparse latente metoder som sparse principale komponenter og sparse partial least squares.
  • Evaluere forskellige usuperviserede dekompositions metoder
  • Sammenligne gennemgåede metoder teoretisk
Kursusindhold
Methods: Clustering, ridge regression, elastic net, sparse principale komponenter, sparse diskriminant analyse og Gaussian mixture analyse, logistisk regression, support vector machine, classification and regression trees, bagging, boosting, random forests, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis, multiway methods, functional data analysis.
Case studies: Varies each year.
Sidst opdateret
02. maj, 2024