22175 Algoritmer i bioinformatik, Ph.d.

2021/2022

Kursusinformation
Algorithms in bioinformatics, PhD
Engelsk
5
Ph.d., Fagligt fokuseret kursus
Kurset udbydes som enkeltfag
Juni
Campus Lyngby
Forelæsninger, diskussioner, øvelser og projekt
3-uger
Aftales med underviser
Mundtlig eksamen og bedømmelse af rapport(er)
Ugentlige øvelser, skriftlig rapport og mundtlig eksamen. Karakteren baseres på en samlet helhedsvurdering af alle tre delprøver.
Alle hjælpemidler er tilladt
7-trins skala , intern bedømmelse
27825 og 36825
22125
22111.22110. , eller lignende. Være i stand til at skrive simple programmer og scripts i et Unix environment for at løse bioinformatiske opgaver på struktureret vis, f.eks. i forbindelse med projektarbejde.
Morten Nielsen , Lyngby Campus, Bygning 204, Tlf. (+45) 4525 2425 , morni@dtu.dk
Carolina Mercedes Barra Quaglia , Lyngby Campus, Bygning 204, Tlf. (+45) 4525 2477 , carolet@dtu.dk
22 Institut for Sundhedsteknologi
I studieplanlæggeren
Overordnede kursusmål
At give de studerende et overblik og dybdegående forståelse af bioinformatiske machine-learning algoritmer. Gøre den studerende i stand til at evaluere hvilke algoritmer, der er bedst egnede til at besvare et givent biologisk spørgsmål, og dernæst udvikle og implementere forudsigelsesværktøjer med sådanne algoritmer til at beskrive komplekse biologiske problemer relateret til f.eks. immunsystemet, vaccineudvikling, genkendelse af sygdomsgener, proteinstruktur og -funktion, post-translational modifikationer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Forstå detaljerne i de mest brugte algoritmer i bioinformatik.
  • Udvikle computerprogrammer, der implementerer disse algoritmer.
  • Vælge den algoritme, der er bedst egnet til at beskrive et givent biologisk problem.
  • Forstå konceptet data redundance og homology reduktion.
  • Udvikle bioinformatiske forudsigelsesalgoritmer, der kan beskrive et givent biologisk problem.
  • Være i stand til - på et detaljeret niveau - at implementere og udvikle forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige neurale netværk, og Skjulte Markov modeller.
  • Designe et projekt hvor et biologisk problem er analyseret ved brug af en eller flere machine-learning algoritmer.
  • Implementere, dokumentere og præsentere et kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatics. Vægten vil blive lagt på den præcise matematiske implementering af algoritmerne i form af computerprogrammer. I løbet af kurset vil forskellige biologiske problemer blive introduceret og analyseret med det formål at belyse styrker og svagheder ved de forskellige algoritmer. Følgende emner bliver dækket i kurset:

Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre klyngealgoritmer
Vægtmatricer: Sequence weighting, pseudo count correction for low counts, Gibbs sampling, og Psi-Blast
Skjulte Markov Modeller: Model construction, Viterbi decoding, posterior decoding, og Baum-Welsh HMM learning
Kunstige neurale netværk: Architectures and sequence encoding, feed-forward algorithm, back propagation og deep neural networks

Kurset består af forelæsninger, diskussioner og computerøvelser hvor de studerende bliver introduceret til de forskellige algoritmer, deres implementation, og anvendelse i analysen af biologiske problemer. Kurset afsluttes med et gruppeprojekt hvor en eller flere af algoritmerne, introduceret på kurset, anvendes til at analysere et biologisk problem. Projektet skal dokumenteres med en rapport skrevet som en videnskabelig artikel indeholdende et dybdegående review af det område, som projektet dækker.
Sidst opdateret
29. april, 2021