23257 Kompositionel analyse af genomiske data

2024/2025

Kursusinformation
Compositional data analysis with applications in genomics
Engelsk
5
Kandidat
Retningsspecifikt kursus (MSc), Bioinformatics and Systems Biology
Teknologisk specialisering (MSc), Bioinformatics and Systems Biology
F2A (man 13-17)
Campus Lyngby
50% forelæsninger, 50% praktiske øvelser
13-uger
F2A
Afløsningsopgave
2 uger
Alle hjælpemidler - med adgang til internettet
7-trins skala , intern bedømmelse
Advanced Engineering Mathematics 1 eller tilsvarende. Introduktion til Python eller tilsvarende
Minimum 10
Christian Brinch , Lyngby Campus, Bygning 204 , cbri@food.dtu.dk
23 Fødevareinstituttet
I studieplanlæggeren
Overordnede kursusmål
I dette kursus introduceres de matematiske metoder der bruges til at analysere, visualisere og fortolke genomiske (kompositionelle) data. Data, som består af proportioner, tælletal, procenter eller koncentrationer er kompositionelle, og de kan ikke analyseres som almindelige multivariate data. Man kan imidlertid transformere kompositioner således at standard multivariate metoder kan anvendes.
Målet med kurset er at forstå de matematiske principper bag kompositioner og lære at vurdere kvaliteten af genomiske data. De studerende lærer at lave eksplorativ dataanalyse, visualisere kompositioner, samt at anvende statistiske metoder på kompositionelle data.
Man møder kompositionelle data i mange grene af videnskaben (fx. geologi, kemi, miljøstudier, sundhedsvidenskab) og derfor er dette kursus relevant for enhver som har interesse i generel data science.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Kunne genkende kompositionelle data og huske de matematiske regler der gælder for denne slags data
  • Beskrive forskellen mellem kompositionelle og ikke-kompositionelle data
  • Gøre rede for og anvende grundlæggende algebraiske principper, så som afstandsmetrikker, vektorrum og logratio-transformationer
  • Anvende de passende transformationer til at udforske kompositionelle data
  • Anvende Bayesianske metoder til at analysere kompositioner med nul-værdier
  • Kunne teste hypoteser på baggrund af kompositionelle data
  • Udføre explorativ analyse af kompositionelle data med PCA
  • Visualisere kompositionalle data
  • Beskrive tidsopløste kompositionalle data som en kompositionel process
  • Forsvare den generelle brug af CoDa metoder til analyse af genomiske data.
Kursusindhold
Dette kursus giver en interdisciplinær introduktion til kompositionel dataanalyse og modellering. Vi tager udgangspunkt i genomiske data, men undervejs vil vi kigge på data fra andre kilder en genetik. Undervisningen består af forelæsninger som vil præsentere de matematiske metoder, samt af øvelser hvor vi arbejder med kompositionelle data.
Bemærkninger
Den studerende forventes at have kendskab til lineær algebra, statistik, og have grundlæggende programmeringserfaring med Python, R, Matlab eller tilsvarende.
Imod slutningen af kurset vil der blive delt sæt af kompositionelle data ud til de studerende (evt. gruppevis) som skal analyseres på baggrund af teknikker som er blevet gennemgået. Denne analyse skal afleveres som en opgave og præsenteres individuelt som en del af den mundtlige eksamen.
Sidst opdateret
02. maj, 2024