Overordnede kursusmål
Computerbaserede metoder spiller allerede nu en afgørende rolle
indenfor mikrobiologien, bioteknologien og lægemiddelforskningen.
Store internationale sekvens- og strukturdatabaser indeholder
information som i mange tilfælde helt kan erstatte eksperimentelt
arbejde, og i andre tilfælde bruges til at få langt mere ud af de
eksperimentelle ressourcer. Kursets mål er at således give de
studerende kendskab til en række nye metoder til molekylær
struktur- og sekvensanalyse.
Introduktion til Bioinformatik er et praktisk orienteret kursus,
med fokus på anvendelse af metoderne. En stor del af undervisningen
består af computer-øvelser, hvor metoderne læres gennem praktisk
brug.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Redegøre for hvordan informationen i biologiske makromolekyler,
såsom DNA og protein, kan repræsenteres i et elektronisk
format.
- Redegøre for hvorledes en fælles evolutionshistorie påvirker
DNA og protein-sekvens i beslægtede organismer.
- Søge efter data i de offentligt tilgængelige sekvens- og
struktur-databaser, såsom GenBank, UniProt og PDB.
- Anvende programmer til visualisering af protein 3D
struktur.
- Fremstille og kritisk evaluere kvaliteten af DNA- og
protein-alignments.
- Søge i sekvensdatabaser med alignment-baserede metoder (BLAST)
og kritisk evaluere pålideligheden af resultaterne.
- Bestemme den sandsynlige biologiske funktion af et ukendt gen
eller protein-produkt ud fra sammenligning med kendte gener /
proteiner.
- Anvende programmer til fremstilling af multiple alignments af
grupper af beslægtede sekvenser.
- Fremstille fylogenetiske træer ud fra multiple alignments.
- Fremstille og tolke visualiseringer af informationsindholdet i
grupper af beslægtede sekvenser (“logo plots”).
Kursusindhold
Evolution på DNA-niveau. Taksonomi. Brug af taksonomi-databaser.
Biologisk information. Informationsindhold i biologiske
makromolekyler. DNA sekventering – herunder fejlkilder. DNA sekvens
på elektronisk form. Brug af GenBank databasen.
Proteinsekvens. Proteinstruktur-niveauer. Elektronisk
repræsentation af proteinsekvens. Kilder til proteinsekvens
(translation og direkte sekventering). Brug af UniProt databasen.
Proteinstruktur. Proteinstruktur bestemmelse. Kvalitet af
proteinstruktur data. Brug af PDB databasen. Computerbaseret
visualisering af proteinstruktur.
Parvis alignment. Alignment score, brug af "gaps",
substitutions-matricer. Globalt og lokalt alignment.
BLAST. Brug af BLAST algoritmen til søgning i sekvensdatabaser.
Kritisk evaluering af søgeresultater. Iterativ BLAST (PSI-BLAST).
Multiple alignments. Brug af heuristiske metoder pga.
datakompleksitet.
Konstruktion og fortolking af fylogenetiske træer ud fra multiple
alignments. Brug af NJ algoritmen. Rodfæstede versus
ikke-rodfæstede træer.
Vægt-matrice baserede metoder. Søgning med vægt-matrice.
Konstruktion og fortolkning af LOGO plots.
Litteraturhenvisninger
Udleverede noter / kompendiemateriale
Sidst opdateret
14. april, 2020