At bibringe studenten viden om avancerede computer intensive
metoder til dataanalyse med applikationer indenfor fx life
sciences. Dette inkluderer problemer med mange variable og relativt
få observationer mv.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Relatere dele af kurset til den studerendes eget projekt
Evaluere krydsvalidering og koncepter som overfitting
Evaluere og anvende sparse regressions og klassifikations
modeller
Evaluere og anvende logistisk regression og support vector
machines
Evaluere og anvende klassifikations og regressions træer
(CART)
Evaluere og anvende random forests
Evaluere og fortolke sparse latente modeller som sparse
principal component analysis
Evaluere og fortolke en række af ikke-superviserede
dekompositions modeller
Evaluere og anvende multiway (tensor) modeller
Evaluere cluster modeller
Kursusindhold:
Methods: Cross-validation, elastic net, sparse principal
components, sparse discriminant analysis and Gaussian mixture
analysis, logistic regression, support vector machine,
classification and regression trees, random forests, clustering,
nonnegative matrix factorization, independent component analysis,
sparse coding, archetypical analysis, mutliway models.