Overordnede kursusmål
At give de studerende et overblik over og en dybdegående forståelse
af bioinformatiske maskinlæringsalgoritmer såsom sequence
alignment, position specific score matrices, hidden Markov models,
gradient descent minimisation methods, og artificial neural
networks. Gøre den studerende i stand til at evaluere hvilke
algoritmer, der er bedst egnede til at besvare et givent biologisk
spørgsmål, og dernæst udvikle og implementere
forudsigelsesværktøjer med sådanne algoritmer til at beskrive
komplekse biologiske problemer relateret til f.eks. immunsystemet,
vaccineudvikling, genkendelse af sygdomsgener, proteinstruktur og
-funktion, posttranslationelle modificeringer m.m.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- forstå detaljerne i disse mest brugte algoritmer i
bioinformatik.
- udvikle computerprogrammer, der implementerer disse
algoritmer.
- vælge den algoritme, der er bedst egnet til at beskrive et
givent biologisk problem.
- forstå konceptet dataredundans og homologi-reduktion.
- udvikle bioinformatiske forudsigelsesalgoritmer, der kan
beskrive et givent biologisk problem.
- være i stand til at implementere og udvikle
forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk
programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige
neurale netværk og Skjulte Markov modeller.
- designe et projekt hvor et biologisk problem er analyseret ved
brug af en eller flere maskinlæringsalgoritmer.
- implementere, dokumentere og præsentere et
kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatik. Vægten vil
blive lagt på den præcise matematiske implementering af
algoritmerne i form af computerprogrammer. I løbet af kurset vil
forskellige biologiske problemer blive introduceret og analyseret
med det formål at belyse styrker og svagheder ved de forskellige
algoritmer. Følgende emner bliver dækket i kurset:
Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og
alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre
klyngealgoritmer
Vægtmatricer: Sekvensvægtning, pseudo count-korrektion for lavt
antal, Gibbs-sampling, og Psi-Blast
Skjulte Markov Modeller: Modelkonstruktion, Viterbi-dekodning,
posterior dekodning, og Baum-Welsh HMM læring
Kunstige neurale netværk: Arkitekturer og sekvenskodning,
feed-forward algoritme, tilbagespredning og dybe neurale netværk
Kurset består af forelæsninger, diskussioner og computerøvelser,
hvor de studerende bliver introduceret til de forskellige
algoritmer, deres implementering, og brug i analysen af biologiske
problemer. Kurset afsluttes med et gruppeprojekt, hvor en eller
flere af algoritmerne introduceret på kurset anvendes til at
analysere et biologisk problem. Projektet skal dokumenteres med en
rapport skrevet som en videnskabelig artikel.
Sidst opdateret
02. maj, 2025