Ph.D.- Konstruktion, Produktion, Byggeri og Transport, Matematik, Fysik og Informatik, Kemi, Bioteknologi og Kemiteknik, Elektronik, Kommunikation og Rumforskning, Life Science
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. Dette inkluderer problemer med mange variable og relativt få observationer mv.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Relatere dele af kurset til den studerendes eget projekt
Evaluere krydsvalidering og koncepter som overfitting
Evaluere og anvende sparse regressions og klassifikations modeller
Evaluere og anvende logistisk regression og support vector machines
Evaluere og anvende klassifikations og regressions træer (CART)
Evaluere og anvende random forests
Evaluere og fortolke sparse latente modeller som sparse principal component analysis
Evaluere og fortolke en række af ikke-superviserede dekomposiitnos modeller
Evaluere og anvende multiway (tensor) modeller
Evaluere kluster modeller
Kursusindhold:
Methods: Cross-validation, elastic net, sparse principal components, sparse discriminant analysis and Gaussian mixture analysis, logistic regression, support vector machine, classification and regression trees, random forests, clustering, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis, mutliway models.