Tretten uger med forelæsninger og databarøvelser. Aktiviteterne
veksler mellem øvelser og forelæsninger. Desuden udføres et mindre
projekt, og de studerende præsenterer deres projekter for hinanden
den sidste kursusuge.
At bibringe studenten viden om avancerede computer intensive
metoder til dataanalyse med applikationer indenfor fx life
sciences. Dette inkluderer problemer med mange variable og relativt
få observationer, hyper-spektrale billeder mv.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Evaluere cluster metoder og vælge passende parametre og metoder
for givne data
Evaluere lineær diskriminant analyse og ridge regression
Evaluere og anvende krydsvalidering, bootstrapping og koncepter
som overfitting.
Evaluere sparse regressions- og klassifikationsmodeller.
Evaluere logistisk regression og support vector klassifikation
for 2-klasse problemer
Evaluere og fortolke Classification and Regression Trees
(CART)
Evaluere bagging, boosting og random forests for klassifikation
og regression.
Evaluere og fortolke sparse latente metoder som sparse
principale komponenter og sparse partial least squares.
Evaluere forskellige usuperviserede dekompositions metoder
Sammenligne gennemgåede metoder
Kursusindhold:
Methods: Clustering, ridge regression, elastic net, sparse
principale komponenter, sparse diskriminant analyse og Gaussian
mixture analyse, logistisk regression, support vector machine,
classification and regression trees, begging, boosting, random
forests, nonnegative matrix factorization, independent component
analysis, sparse coding, archetypical analysis.
Case studies: multispektrale billeder, mm.
Bemærkninger:
Elitestuderende under MMC-masteren, samt PhD-studerende har
mulighed for yderligere specialisering ved at tage kursus 02583.
Det er forventet at elitestuderende deltager i ikke-obligatoriske
projekter.