At give de studerende et overblink og dybdegående forståelse af bioinformatiske machine-learning algoritmer. Gøre den studerende i stand til at evaluere hvilke algoritmer, der er bedst egnede til at svare på et givent biologisk spørgsmål, og dernæst udvikle og implementere forudsigelsesværktøjer med sådanne algoritmer til at beskrive komplekse biologiske problemer relateret til f.eks. immunsystemet, vaccine discovery, genkendelse af sygdoms gener, protein struktur og funktion, post-ralationel modifications.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Forstå detaljerne i de mest brugte algoritmer i bioinformatics.
Udvikle computer programmer der implementer disse algoritmer.
Vælge den algoritme der er bedst egnet til at beskrive et givent biologisk problem.
Forstår konceptet data redundance og homology reduktion.
Udvilke bioinformatiske forudsigelses algoritmer, der kan beskrive et givent biologisk problem.
På et detaljeret niveau at implementere og udvikle værktøjer ved brug af en eller flere af følgende algortimer: Dynamic programming, Sequence clustering, Weight matrices, Artificial neural networks, Hidden Markov models og Support vector machines.
Designe et projekt hvor et biologisk problem er analyseret ved brug af en eller flere machine-learning algoritmer.
Implementere, dokumentere og præsentere et kursus projekt.
Kursusindhold:
Kurset dækker de mest brugte algoritmer i bioinformatics. Vægten vil blive lagt på den præcise matematiske implementering af algoritmerne in form af computerprogrammer. I løbet af kurset vil forskellige biologiske problemer blive introduceret og analyseret med det formål at belyse styrker og svagheder ved de forskellige algoritmer. Følgende emner bliver dækket i kurset:
Dynamic programming: Needleman-Wunsch, Smith-Waterman, og alignment heuristics. Data redundancy og homology reduction: Hobohm og andre clustering algoritmer. Weight matrices: Sequence weighting, pseudo count correction for low counts, Gibbs sampling, og Psi-Blast. Hidden Markov Models: Model construction, Viterbi decoding, posterior decoding og Baum-Welsh HMM learning. Artificial neural networks: Architectures and sequence encoding, feed-forward algorithm og back propagation. Support vector machines: Linear classification, Kernels, and Non-linear classification.
Kurset består af forelæsninger, diskussioner, computerøvelser hvor de studerende bliver introduceret til de forskellige algoritmer, deres implementation, og brug i analysen af biologiske problemer.
Mulighed for GRØN DYST deltagelse:
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk/kursustilmelding.aspx