22175 Algoritmer i bioinformatik, Ph.d. (2021/2022)

22175 Algoritmer i bioinformatik, Ph.d.

2021/2022

Kursusinformation

Engelsk titel	Algorithms in bioinformatics, PhD
Undervisningssprog	Engelsk
Point( ECTS )	5
Kursustype	Ph.d., Fagligt fokuseret kursus Kurset udbydes som enkeltfag

Skemaplacering	Juni
Undervisningens placering	Campus Lyngby
Undervisningsform	Forelæsninger, diskussioner, øvelser og projekt
Kursets varighed	3-uger
Eksamensplacering	Aftales med underviser
Evalueringsform	Mundtlig eksamen og bedømmelse af rapport(er) Ugentlige øvelser, skriftlig rapport og mundtlig eksamen. Karakteren baseres på en samlet helhedsvurdering af alle tre delprøver.
Hjælpemidler	Alle hjælpemidler er tilladt
Bedømmelsesform	7-trins skala , intern bedømmelse
Tidligere kursus	27825 og 36825
Pointspærring	22125
Anbefalede forudsætninger	22111.22110. , eller lignende. Være i stand til at skrive simple programmer og scripts i et Unix environment for at løse bioinformatiske opgaver på struktureret vis, f.eks. i forbindelse med projektarbejde.

Kursusansvarlig	Morten Nielsen , Lyngby Campus, Bygning 204, Tlf. (+45) 4525 2425 , morni@dtu.dk
Medansvarlige	Carolina Mercedes Barra Quaglia , Lyngby Campus, Bygning 204, Tlf. (+45) 4525 2477 , carolet@dtu.dk
Institut	22 Institut for Sundhedsteknologi
Tilmelding	I studieplanlæggeren

Overordnede kursusmål

At give de studerende et overblik og dybdegående forståelse af bioinformatiske machine-learning algoritmer. Gøre den studerende i stand til at evaluere hvilke algoritmer, der er bedst egnede til at besvare et givent biologisk spørgsmål, og dernæst udvikle og implementere forudsigelsesværktøjer med sådanne algoritmer til at beskrive komplekse biologiske problemer relateret til f.eks. immunsystemet, vaccineudvikling, genkendelse af sygdomsgener, proteinstruktur og -funktion, post-translational modifikationer.

Læringsmål

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:

Forstå detaljerne i de mest brugte algoritmer i bioinformatik.
Udvikle computerprogrammer, der implementerer disse algoritmer.
Vælge den algoritme, der er bedst egnet til at beskrive et givent biologisk problem.
Forstå konceptet data redundance og homology reduktion.
Udvikle bioinformatiske forudsigelsesalgoritmer, der kan beskrive et givent biologisk problem.
Være i stand til - på et detaljeret niveau - at implementere og udvikle forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige neurale netværk, og Skjulte Markov modeller.
Designe et projekt hvor et biologisk problem er analyseret ved brug af en eller flere machine-learning algoritmer.
Implementere, dokumentere og præsentere et kursusprojekt.

Kursusindhold

Kurset dækker de mest brugte algoritmer i bioinformatics. Vægten vil blive lagt på den præcise matematiske implementering af algoritmerne i form af computerprogrammer. I løbet af kurset vil forskellige biologiske problemer blive introduceret og analyseret med det formål at belyse styrker og svagheder ved de forskellige algoritmer. Følgende emner bliver dækket i kurset:

Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre klyngealgoritmer
Vægtmatricer: Sequence weighting, pseudo count correction for low counts, Gibbs sampling, og Psi-Blast
Skjulte Markov Modeller: Model construction, Viterbi decoding, posterior decoding, og Baum-Welsh HMM learning
Kunstige neurale netværk: Architectures and sequence encoding, feed-forward algorithm, back propagation og deep neural networks

Kurset består af forelæsninger, diskussioner og computerøvelser hvor de studerende bliver introduceret til de forskellige algoritmer, deres implementation, og anvendelse i analysen af biologiske problemer. Kurset afsluttes med et gruppeprojekt hvor en eller flere af algoritmerne, introduceret på kurset, anvendes til at analysere et biologisk problem. Projektet skal dokumenteres med en rapport skrevet som en videnskabelig artikel indeholdende et dybdegående review af det område, som projektet dækker.

Sidst opdateret

29. april, 2021