Overordnede kursusmål
Computerbaserede metoder spiller i disse år en afgørende rolle
indenfor molekylærbiologi, mikrobiologi, bioteknologi og
lægemiddelforskning. Store internationale sekvens- og
strukturdatabaser indeholder information som i mange tilfælde helt
kan erstatte eksperimentelt arbejde, og i andre tilfælde bruges til
at optimere udbyttet af de eksperimentelle ressourcer. Kursets mål
er således at give de studerende kendskab til de vigtigste
databaser og metoder til molekylær sekvens- og strukturanalyse.
Introduktion til Bioinformatik er et praktisk orienteret kursus,
med fokus på anvendelse af metoderne snarere end deres matematiske
udledning. Bioinformatik præsenteres som en biologisk disciplin
baseret på evolutionsteori. En stor del af undervisningen består af
computer-øvelser, hvor de beregningsmæssige værktøjer anvendes
baseret på deltagernes biologiske forhåndskendskab.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- redegøre for hvordan informationen i biologiske makromolekyler,
såsom DNA og protein, kan repræsenteres i et elektronisk
format.
- redegøre for hvorledes en fælles evolutionshistorie påvirker
DNA og protein-sekvens i beslægtede organismer.
- søge efter data i de offentligt tilgængelige sekvens- og
struktur-databaser, såsom GenBank, UniProt og PDB.
- anvende programmer til visualisering af protein 3D
struktur.
- fremstille og kritisk evaluere kvaliteten af DNA- og
protein-alignments.
- søge i sekvensdatabaser med alignment-baserede metoder (BLAST)
og kritisk evaluere pålideligheden af resultaterne.
- bestemme den sandsynlige biologiske funktion af et ukendt gen
eller protein-produkt ud fra sammenligning med kendte gener /
proteiner.
- anvende programmer til at fremstille multiple alignments af
grupper af beslægtede sekvenser.
- fremstille fylogenetiske træer ud fra multiple alignments.
- fremstille og tolke visualiseringer af informationsindholdet i
grupper af beslægtede sekvenser (“logo plots”).
Kursusindhold
Evolution på DNA-niveau. Taksonomi. Brug af taksonomi-databaser.
Biologisk information. Informationsindhold i biologiske
makromolekyler. DNA sekventering – herunder fejlkilder. DNA sekvens
på elektronisk form. Brug af GenBank databasen.
Proteinsekvens. Proteinstruktur-niveauer. Elektronisk
repræsentation af proteinsekvens. Kilder til proteinsekvens
(translation og direkte sekventering). Brug af UniProt databasen.
Proteinstruktur. Proteinstruktur bestemmelse. Kvalitet af
proteinstruktur data. Brug af PDB databasen. Computerbaseret
visualisering af proteinstruktur.
Parvis alignment. Alignment score, brug af "gaps",
substitutions-matricer. Globalt og lokalt alignment.
BLAST. Brug af BLAST algoritmen til søgning i sekvensdatabaser.
Kritisk evaluering af søgeresultater. Iterativ BLAST (PSI-BLAST).
Multiple alignments. Brug af heuristiske metoder pga.
datakompleksitet.
Konstruktion og fortolking af fylogenetiske træer ud fra multiple
alignments. Brug af NJ algoritmen. Rodfæstede versus
ikke-rodfæstede træer.
Vægt-matrice baserede metoder. Søgning med vægt-matrice.
Konstruktion og fortolkning af LOGO plots.
Litteraturhenvisninger
Udleverede noter / kompendiemateriale
Sidst opdateret
02. maj, 2024