23257 Kompositionel analyse af genomiske data

2020/2021

Kursusinformation
Compositional data analysis with applications in genomics
Engelsk
5
Kandidat
F2A (man 13-17)
Campus Lyngby
50% forelæsninger, 50% praktiske øvelser
13-uger
F2A
Mundtlig eksamen
20 min
Uden hjælpemidler
7-trins skala , intern bedømmelse
Minimum 10
Christian Brinch , Lyngby Campus, Bygning 204, Tlf. (+45) 3588 6354 , cbri@food.dtu.dk
23 Fødevareinstituttet
I studieplanlæggeren
Overordnede kursusmål
I dette kursus introduceres de matematiske metoder der bruges til at analysere, visualisere og fortolke genomiske (kompositionelle) data. Data, som består af proportioner, tælletal, procenter eller koncentrationer er kompositionelle, og de kan ikke analyseres som almindelige multivariate data. Man kan imidlertid transformere kompositioner således at standard multivariate metoder kan anvendes.
Målet med kurset er at forstå de matematiske principper bag kompositioner og lære at vurdere kvaliteten af genomiske data. De studerende lærer at lave eksplorativ dataanalyse, visualisere kompositioner, samt at anvende statistiske metoder på kompositionelle data.
Man møder kompositionelle data i mange grene af videnskaben (fx. geologi, kemi, miljøstudier, sundhedsvidenskab) og derfor er dette kursus relevant for enhver som har interesse i generel data science.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Kunne genkende kompositionelle data og huske de matematiske regler der gælder for denne slags data
  • Forstå forskellen mellem kompositionelle og ikke-kompositionelle data
  • Forstå grundlæggende algebraiske principper, så som afstandsmetrikker, vektorrum og logratio-transformationer
  • Anvende de passende transformationer til at udforske kompositionelle data
  • Anvende Bayesianske metoder til at analysere kompositioner med nul-værdier
  • Vælge og anvende de passende metoder til dataanalyse
  • Kunne teste hypoteser på baggrund af kompositionelle data
  • Drage korrekte konklusioner på baggrund af kompositionelle data
Kursusindhold
Dette kursus giver en interdisciplinær introduktion til kompositionel dataanalyse og modellering. Vi tager udgangspunkt i genomiske data, men undervejs vil vi kigge på data fra andre kilder en genetik. Undervisningen består af forelæsninger som vil præsentere de matematiske metoder, samt af øvelser hvor vi arbejder med kompositionelle data.
Bemærkninger
Den studerende forventes at have kendskab til lineær algebra, statistik, og have grundlæggende programmeringserfaring med Python, R, Matlab eller tilsvarende.
Imod slutningen af kurset vil der blive delt sæt af kompositionelle data ud til de studerende (evt. gruppevis) som skal analyseres på baggrund af teknikker som er blevet gennemgået. Denne analyse skal afleveres som en opgave og præsenteres individuelt som en del af den mundtlige eksamen. Karakteren vil blive givet på baggrund af en samlet vurdering.
Sidst opdateret
28. april, 2020