2010/2011

27823 Algorithmer i Bioinformatik

Engelsk titel: 


Algorithms in Bioinformatics

Sprog:


Point (ECTS )


10

Kursustype:   

Ph.D.- Kemi, Bioteknologi og Kemiteknik


Skemaplacering:

E4A og E4B

 

Undervisningsform:

Forelæsninger, diskussioner, øvelser og projekt

Kursets varighed:

13-uger

Eksamensplacering:

E4A,   F4A 

Evalueringsform:

Hjælpemidler:

Bedømmelsesform:

Faglige forudsætninger:

,

Ønskelige forudsætninger:

,

Overordnede kursusmål:

At give de studerende et overblink og dybdegående forståelse af bioinformatiske machine-learning algoritmer. Gøre den studerende i stand til at evaluere hvilke algoritmer, der er bedst egnede til at svare på et givent biologisk spørgsmål, og dernæst udvikle og implementere forudsigelsesværktøjer med sådanne algoritmer til at beskrive komplekse biologiske problemer relateret til f.eks. immunsystemet, vaccine discovery, genkendelse af sygdoms gener, protein struktur og funktion, post-ralationel modifications.


Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Forstå detaljerne i de mest brugte algoritmer i bioinformatics.
  • Udvikle computer programmer der implementer disse algoritmer.
  • Vælge den algoritme der er bedst egnet til at beskrive et givent biologisk problem.
  • Forstår konceptet data redundance og homology reduktion.
  • Udvilke bioinformatiske forudsigelses algoritmer, der kan beskrive et givent biologisk problem.
  • På et detaljeret niveau at implementere og udvikle værktøjer ved brug af en eller flere af følgende algortimer: Dynamic programming, Sequence clustering, Weight matrices, Artificial neural networks, Hidden Markov models og Support vector machines.
  • Designe et projekt hvor et biologisk problem er analyseret ved brug af en eller flere machine-learning algoritmer.
  • Implementere, dokumentere og præsentere et kursus projekt.

Kursusindhold:

Kurset dækker de mest brugte algoritmer i bioinformatics. Vægten vil blive lagt på den præcise matematiske implementering af algoritmerne in form af computerprogrammer. I løbet af kurset vil forskellige biologiske problemer blive introduceret og analyseret med det formål at belyse styrker og svagheder ved de forskellige algoritmer. Følgende emner bliver dækket i kurset:

Dynamic programming: Needleman-Wunsch, Smith-Waterman, og alignment heuristics.
Data redundancy og homology reduction: Hobohm og andre clustering algoritmer.
Weight matrices: Sequence weighting, pseudo count correction for low counts, Gibbs sampling, og Psi-Blast.
Hidden Markov Models: Model construction, Viterbi decoding, posterior decoding og Baum-Welsh HMM learning.
Artificial neural networks: Architectures and sequence encoding, feed-forward algorithm og back propagation.
Support vector machines: Linear classification, Kernels, and Non-linear classification.

Kurset består af forelæsninger, diskussioner, computerøvelser hvor de studerende bliver introduceret til de forskellige algoritmer, deres implementation, og brug i analysen af biologiske problemer.


Kursusansvarlig:

Morten Nielsen, 208, 15, (+45) 4525 2425, mniel@cbs.dtu.dk  

Institut:

27 Institut for Systembiologi

Tilmelding:

På instituttet
hos Dorthe Kjærsgaard mail dorthek@cbs.dtu.dk

Nøgleord:

Bioinformatics, algorithms, sequence analysis, sequence alignment, artificial neural networks, hidden Markov models, weight matrices
Sidst opdateret: 20. april, 2010