Overordnede kursusmål
At give de studerende et overblik og en dybdegående forståelse af
bioinformatiske machine-learning algoritmer. Gøre den studerende i
stand til at evaluere hvilke algoritmer, der er bedst egnede til at
svare på et givent biologisk spørgsmål, og dernæst udvikle og
implementere forudsigelsesværktøjer med sådanne algoritmer til at
beskrive komplekse biologiske problemer relateret til f.eks.
immunsystemet, vaccine discovery, genkendelse af sygdoms gener,
protein struktur og funktion, post-translational modifications.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forstå detaljerne i de mest brugte algoritmer i
bioinformatics.
- Udvikle computer programmer der implementerer disse
algoritmer.
- Vælge den algoritme der er bedst egnet til at beskrive et
givent biologisk problem.
- Forstår konceptet data redundance og homology reduktion.
- Udvikle bioinformatiske forudsigelses algoritmer der kan
beskrive et givent biologisk problem.
- På et detaljeret niveau, vil den studerende blive i stand til
at implementere og udvikle forudsigelsesværktøjer ved at bruge
følgende algoritmer: Dynamic programming, Sequence clustering,
Weight matrices, Artificial neural networks og Hidden Markov
models
- Designe et projekt hvor et biologisk problem er analyseret ved
brug af en eller flere machine-learning algoritmer.
- Implementere, dokumentere og præsentere et
kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatics. Vægten
vil blive lagt på den præcise matematiske implementering af
algoritmerne i form af computerprogrammer. I løbet af kurset vil
forskellige biologiske problemer blive introduceret og analyseret
med det formål at belyse styrker og svagheder ved de forskellige
algoritmer. Følgende emner bliver dækket i kurset:
Dynamic programming: Needleman-Wunsch, Smith-Waterman, og alignment
heuristics
Data redundancy og homology reduction: Hobohm og andre clustering
algoritmer
Weight matrices: Sequence weighting, pseudo count correction for
low counts, Gibbs sampling, og Psi-Blast
Hidden Markov Models: Model construction, Viterbi decoding,
posterior decoding, og Baum-Welsh HMM learning
Artificial neural networks: Architectures and sequence encoding,
feed-forward algorithm, back propagation, and deep neural networks
Kurset består af forelæsninger, diskussioner, computerøvelser hvor
de studerende bliver introduceret til de forskellige algoritmer,
deres implementation, og brug i analysen af biologiske problemer.
Kurset afsluttes med et gruppeprojekt hvor en eller flere af
algoritmerne introduceret på kurset anvendes til at analysere et
biologisk problem. Projektet skal dokumenteres med en rapport
skrevet som en videnskabelig artikel.
Sidst opdateret
04. maj, 2018