Overordnede kursusmål
At give de studerende et overblik over og en dybdegående forståelse
af bioinformatiske maskinlæringsalgoritmer. Gøre den studerende i
stand til at evaluere hvilke algoritmer, der er bedst egnede til at
besvare et givent biologisk spørgsmål, og dernæst udvikle og
implementere forudsigelsesværktøjer med sådanne algoritmer til at
beskrive komplekse biologiske problemer relateret til f.eks.
immunsystemet, vaccineudvikling, genkendelse af sygdomsgener,
proteinstruktur og -funktion, posttranslationelle modificeringer
m.m.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- forstå detaljerne i de mest brugte algoritmer i
bioinformatik.
- udvikle computerprogrammer, der implementerer disse
algoritmer.
- vælge den algoritme, der er bedst egnet til at beskrive et
givent biologisk problem.
- forstå konceptet dataredundans og homologi-reduktion.
- udvikle bioinformatiske forudsigelsesalgoritmer, der kan
beskrive et givent biologisk problem.
- være i stand til at implementere og udvikle
forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk
programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige
neurale netværk og Skjulte Markov modeller.
- designe et projekt hvor et biologisk problem er analyseret ved
brug af en eller flere maskinlæringsalgoritmer.
- implementere, dokumentere og præsentere et
kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatik. Vægten vil
blive lagt på den præcise matematiske implementering af
algoritmerne i form af computerprogrammer. I løbet af kurset vil
forskellige biologiske problemer blive introduceret og analyseret
med det formål at belyse styrker og svagheder ved de forskellige
algoritmer. Følgende emner bliver dækket i kurset:
Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og
alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre
klyngealgoritmer
Vægtmatricer: Sekvensvægtning, pseudo count-korrektion for lavt
antal, Gibbs-sampling, og Psi-Blast
Skjulte Markov Modeller: Modelkonstruktion, Viterbi-dekodning,
posterior dekodning, og Baum-Welsh HMM læring
Kunstige neurale netværk: Arkitekturer og sekvenskodning,
feed-forward algoritme, tilbagespredning og dybe neurale netværk
Kurset består af forelæsninger, diskussioner og computerøvelser,
hvor de studerende bliver introduceret til de forskellige
algoritmer, deres implementation, og brug i analysen af biologiske
problemer. Kurset afsluttes med et gruppeprojekt, hvor en eller
flere af algoritmerne introduceret på kurset anvendes til at
analysere et biologisk problem. Projektet skal dokumenteres med en
rapport skrevet som en videnskabelig artikel.
Sidst opdateret
02. maj, 2024