Overordnede kursusmål
I dette kursus introduceres de matematiske metoder der bruges til
at analysere, visualisere og fortolke genomiske (kompositionelle)
data. Data, som består af proportioner, tælletal, procenter eller
koncentrationer er kompositionelle, og de kan ikke analyseres som
almindelige multivariate data. Man kan imidlertid transformere
kompositioner således at standard multivariate metoder kan
anvendes.
Målet med kurset er at forstå de matematiske principper bag
kompositioner og lære at vurdere kvaliteten af genomiske data. De
studerende lærer at lave eksplorativ dataanalyse, visualisere
kompositioner, samt at anvende statistiske metoder på
kompositionelle data.
Man møder kompositionelle data i mange grene af videnskaben (fx.
geologi, kemi, miljøstudier, sundhedsvidenskab) og derfor er dette
kursus relevant for enhver som har interesse i generel data
science.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Kunne genkende kompositionelle data og huske de matematiske
regler der gælder for denne slags data
- Forstå forskellen mellem kompositionelle og
ikke-kompositionelle data
- Forstå grundlæggende algebraiske principper, så som
afstandsmetrikker, vektorrum og logratio-transformationer
- Anvende de passende transformationer til at udforske
kompositionelle data
- Anvende Bayesianske metoder til at analysere kompositioner med
nul-værdier
- Vælge og anvende de passende metoder til dataanalyse
- Kunne teste hypoteser på baggrund af kompositionelle data
- Drage korrekte konklusioner på baggrund af kompositionelle
data
Kursusindhold
Dette kursus giver en interdisciplinær introduktion til
kompositionel dataanalyse og modellering. Vi tager udgangspunkt i
genomiske data, men undervejs vil vi kigge på data fra andre kilder
en genetik. Undervisningen består af forelæsninger som vil
præsentere de matematiske metoder, samt af øvelser hvor vi arbejder
med kompositionelle data.
Bemærkninger
Den studerende forventes at have kendskab til lineær algebra,
statistik, og have grundlæggende programmeringserfaring med Python,
R, Matlab eller tilsvarende.
Imod slutningen af kurset vil der blive delt sæt af kompositionelle
data ud til de studerende (evt. gruppevis) som skal analyseres på
baggrund af teknikker som er blevet gennemgået. Denne analyse skal
afleveres som en opgave og præsenteres individuelt som en del af
den mundtlige eksamen. Karakteren vil blive givet på baggrund af en
samlet vurdering.
Sidst opdateret
28. april, 2020