Overordnede kursusmål
Computerbaserede metoder spiller allerede nu en afgørende rolle
indenfor mikrobiologien, bioteknologien og lægemiddelforskningen.
Store internationale sekvens- og strukturdatabaser indeholder
information som i mange tilfælde helt kan erstatte eksperimentelt
arbejde, og i andre tilfælde bruges til at få langt mere ud af de
eksperimentelle ressourcer. Kursets mål er at således give de
studerende kendskab til en række nye metoder til molekylær
struktur- og sekvensanalyse.
Introduktion til Bioinformatik er et praktisk orienteret kursus,
med fokus på anvendelse af metoderne. En stor del af undervisningen
består af computer-øvelser, hvor metoderne læres gennem praktisk
brug.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Redegøre for hvordan informationen i biologiske
makro-molekyler, såsom DNA og protein, kan repræsenteres i et
elektronisk format.
- Redegøre for hvorledes en fælles evolutionshistorie påvirker
DNA og protein-sekvens i beslægtede organismer.
- Søge efter data i de offentligt tilgængelige sekvens- og
struktur-databaser, såsom GenBank, UniProt og PDB.
- Anvende programmer til visualisering af protein 3D
struktur.
- Fremstille og kritisk evaluere kvaliteten af DNA- og
protein-alignments.
- Søge i sekvensdatabaser med alignment-baserede metoder (BLAST)
og kritisk evaluere pålideligheden af resultaterne.
- Bestemme den sandsynlige biologiske funktion af et ukendt gen
eller protein-produkt ud fra sammenligning med kendte gener /
proteiner.
- Anvende programmer til fremstilling af multiple alignments af
grupper af beslægtede sekvenser – herunder af kende forskellen på
de to hovedgrupper af algoritmer: globalt optimerende og lokalt
optimerende.
- Fremstille fylogenetiske træer ud fra multiple alignments.
- Fremstille og tolke visualiseringer af informationsindholdet i
grupper af beslægtede sekvenser (“logo plots”).
Kursusindhold
Evolution på DNA-niveau. Taksonomi. Brug af taksonomi-databaser.
Biologisk information. Informationsindhold i biologiske
makro-molekyler. DNA sekventering – herunder fejlkilder. DNA
sekvens på elektronisk form. Brug af GenBank databasen.
Protein-sekvens. Proteinstruktur-niveauer. Elektronisk
repræsentation af protein-sekvens. Kilder til protein-sekvens
(translation og direkte sekventering). Brug af UniProt databasen.
Protein-struktur. Protein-struktur bestemmelse. Kvalitet af
protein-struktur data. Brug af PDB databasen. Computerbaseret
visualisering af protein-struktur.
Parvis alignment. Alignment score, brug af "gaps",
substitutions-matricer. Globalt og lokalt alignment.
BLAST. Brug af BLAST algoritmen til søgning i sekvensdatabaser.
Kritisk evaluering af søgeresultater. Iterativ BLAST.
Multiple alignments. Brug af heuristiske metoder pga.
datakompleksitet. Globalt og lokalt optimerende metoder.
Konstruktion og fortolking af fylogenetiske træer ud fra multiple
alignments. Brug af NJ algoritmen. Rodfæstede versus
ikke-rodfæstede træer.
Vægt-matrice baserede metoder. Søgning med vægt-matrice.
Konstruktion og fortolkning af LOGO plots.
Litteraturhenvisninger
Udleverede noter / kompendiemateriale
Sidst opdateret
01. november, 2016