Overordnede kursusmål
At give de studerende et overblik og dybdegående forståelse af
bioinformatiske machine-learning algoritmer. Gøre den studerende i
stand til at evaluere hvilke algoritmer, der er bedst egnede til at
besvare et givent biologisk spørgsmål, og dernæst udvikle og
implementere forudsigelsesværktøjer med sådanne algoritmer til at
beskrive komplekse biologiske problemer relateret til f.eks.
immunsystemet, vaccineudvikling, genkendelse af sygdomsgener,
proteinstruktur og -funktion, post-translational modifikationer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Forstå detaljerne i de mest brugte algoritmer i
bioinformatik.
- Udvikle computerprogrammer, der implementerer disse
algoritmer.
- Vælge den algoritme, der er bedst egnet til at beskrive et
givent biologisk problem.
- Forstå konceptet data redundance og homology reduktion.
- Udvikle bioinformatiske forudsigelsesalgoritmer, der kan
beskrive et givent biologisk problem.
- Være i stand til - på et detaljeret niveau - at implementere og
udvikle forudsigelsesværktøjer ved at bruge følgende algoritmer:
Dynamisk programmering, Sekvens-klyngedannelse, Vægtmatricer,
Kunstige neurale netværk, og Skjulte Markov modeller.
- Designe et projekt hvor et biologisk problem er analyseret ved
brug af en eller flere machine-learning algoritmer.
- Implementere, dokumentere og præsentere et
kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatics. Vægten
vil blive lagt på den præcise matematiske implementering af
algoritmerne i form af computerprogrammer. I løbet af kurset vil
forskellige biologiske problemer blive introduceret og analyseret
med det formål at belyse styrker og svagheder ved de forskellige
algoritmer. Følgende emner bliver dækket i kurset:
Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og
alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre
klyngealgoritmer
Vægtmatricer: Sequence weighting, pseudo count correction for low
counts, Gibbs sampling, og Psi-Blast
Skjulte Markov Modeller: Model construction, Viterbi decoding,
posterior decoding, og Baum-Welsh HMM learning
Kunstige neurale netværk: Architectures and sequence encoding,
feed-forward algorithm, back propagation og deep neural networks
Kurset består af forelæsninger, diskussioner og computerøvelser
hvor de studerende bliver introduceret til de forskellige
algoritmer, deres implementation, og anvendelse i analysen af
biologiske problemer. Kurset afsluttes med et gruppeprojekt hvor en
eller flere af algoritmerne, introduceret på kurset, anvendes til
at analysere et biologisk problem. Projektet skal dokumenteres med
en rapport skrevet som en videnskabelig artikel indeholdende et
dybdegående review af det område, som projektet dækker.
Sidst opdateret
29. april, 2021