Overordnede kursusmål
I dette kursus introduceres de matematiske metoder der bruges til
at analysere, visualisere og fortolke genomiske (kompositionelle)
data. Data, som består af proportioner, tælletal, procenter eller
koncentrationer er kompositionelle, og de kan ikke analyseres som
almindelige multivariate data. Man kan imidlertid transformere
kompositioner således at standard multivariate metoder kan
anvendes.
Målet med kurset er at forstå de matematiske principper bag
kompositioner og lære at vurdere kvaliteten af genomiske data. De
studerende lærer at lave eksplorativ dataanalyse, visualisere
kompositioner, samt at anvende statistiske metoder på
kompositionelle data.
Man møder kompositionelle data i mange grene af videnskaben (fx.
geologi, kemi, miljøstudier, sundhedsvidenskab) og derfor er dette
kursus relevant for enhver som har interesse i generel data
science.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Kunne genkende kompositionelle data og huske de matematiske
regler der gælder for denne slags data
- Beskrive forskellen mellem kompositionelle og
ikke-kompositionelle data
- Gøre rede for og anvende grundlæggende algebraiske principper,
så som afstandsmetrikker, vektorrum og
logratio-transformationer
- Anvende de passende transformationer til at udforske
kompositionelle data
- Anvende Bayesianske metoder til at analysere kompositioner med
nul-værdier
- Kunne teste hypoteser på baggrund af kompositionelle data
- Udføre explorativ analyse af kompositionelle data med PCA
- Visualisere kompositionalle data
- Beskrive tidsopløste kompositionalle data som en kompositionel
process
- Forsvare den generelle brug af CoDa metoder til analyse af
genomiske data.
Kursusindhold
Dette kursus giver en interdisciplinær introduktion til
kompositionel dataanalyse og modellering. Vi tager udgangspunkt i
genomiske data, men undervejs vil vi kigge på data fra andre kilder
en genetik. Undervisningen består af forelæsninger som vil
præsentere de matematiske metoder, samt af øvelser hvor vi arbejder
med kompositionelle data.
Bemærkninger
Den studerende forventes at have kendskab til lineær algebra,
statistik, og have grundlæggende programmeringserfaring med Python,
R, Matlab eller tilsvarende.
Imod slutningen af kurset vil der blive delt sæt af kompositionelle
data ud til de studerende (evt. gruppevis) som skal analyseres på
baggrund af teknikker som er blevet gennemgået. Denne analyse skal
afleveres som en opgave og præsenteres individuelt som en del af
den mundtlige eksamen.
Sidst opdateret
02. maj, 2024