Overordnede kursusmål
At give de studerende et overblik og en dybdegående forståelse af
bioinformatiske machine-learning algoritmer. Gøre den studerende i
stand til at evaluere hvilke algoritmer, der er bedst egnede til at
besvare et givent biologisk spørgsmål, og dernæst udvikle og
implementere forudsigelsesværktøjer med sådanne algoritmer til at
beskrive komplekse biologiske problemer relateret til f.eks.
immunsystemet, vaccineudvikling, genkendelse af sygdomsgener,
proteinstruktur og -funktion, post-translational modifications.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forstå detaljerne i de mest brugte algoritmer i
bioinformatik.
- Udvikle computerprogrammer, der implementerer disse
algoritmer.
- Vælge den algoritme, der er bedst egnet til at beskrive et
givent biologisk problem.
- Forstå konceptet data redundance og homology reduktion.
- Udvikle bioinformatiske forudsigelsesalgoritmer, der kan
beskrive et givent biologisk problem.
- Være i stand til at implementere og udvikle
forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk
programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige
neurale netværk og Skjulte Markov modeller.
- Designe et projekt hvor et biologisk problem er analyseret ved
brug af en eller flere machine-learning algoritmer.
- Implementere, dokumentere og præsentere et
kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatik. Vægten vil
blive lagt på den præcise matematiske implementering af
algoritmerne i form af computerprogrammer. I løbet af kurset vil
forskellige biologiske problemer blive introduceret og analyseret
med det formål at belyse styrker og svagheder ved de forskellige
algoritmer. Følgende emner bliver dækket i kurset:
Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og
alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre
klyngealgoritmer
Vægtmatricer: Sequence weighting, pseudo count correction for low
counts, Gibbs sampling, og Psi-Blast
Skjulte Markov Modeller: Model construction, Viterbi decoding,
posterior decoding, og Baum-Welsh HMM learning
Kunstige neurale netværk: Architectures and sequence encoding,
feed-forward algorithm, back propagation, and deep neural networks
Kurset består af forelæsninger, diskussioner, computerøvelser hvor
de studerende bliver introduceret til de forskellige algoritmer,
deres implementation, og brug i analysen af biologiske problemer.
Kurset afsluttes med et gruppeprojekt hvor en eller flere af
algoritmerne introduceret på kurset anvendes til at analysere et
biologisk problem. Projektet skal dokumenteres med en rapport
skrevet som en videnskabelig artikel.
Sidst opdateret
31. marts, 2023