Tretten uger med forelæsninger og databarøvelser. Aktiviteterne veksler mellem øvelser og forelæsninger. Desuden udføres et mindre projekt, og de studerende præsenterer deres projekter for hinanden den sidste kursusuge.
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer, hyper-spektrale billeder mv.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Evaluere cluster metoder og vælge passende parametre og metoder for givne data
Evaluere lineær diskriminant analyse og ridge regression
Evaluere og anvende krydsvalidering og koncepter som overfitting.
Evaluere sparse regressions- og klassifikationsmodeller. Bayesiansk inferens
Evaluere logistisk regression og support vector klassifikation for 2-klasse problemer
Evaluere og fortolke Classification and Regression Trees (CART)
Evaluere random forests for klassifikation og regression.
Evaluere og fortolke sparse latente metoder som sparse principale komponenter og sparse partial least squares.
Evaluere forskellige usuperviserede dekompositions metoder
Evaluere multiway (tensor) models
Evaluere og formidle et relateret emne af eget valg
Sammenligne gennemgåede metoder
Kursusindhold:
Methods: Clustering, ridge regression, elastic net, sparse principale komponenter, sparse diskriminant analyse og Gaussian mixture analyse, logistisk regression, support vector machine, classification and regression trees, random forests, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis, mutliway models. Case studies: multispektrale billeder, mm.
Bemærkninger:
Elitestuderende under MMC-masteren, samt PhD-studerende har mulighed for yderligere specialisering ved sideløbende at tage kursus 02583.