22111 Introduktion til bioinformatik

2020/2021

P.g.a. Covid-19 afholdes den skriftlige eksamen for sommeren 2021 som hjemmeonline-eksamen med alle hjælpemidler tilladt og åbent net.
Kursusinformation
Introduction to Bioinformatics
Engelsk
5
Bachelor
Kurset udbydes som enkeltfag
F4A (tirs 13-17)
Campus Lyngby
Forelæsninger og praktiske øvelser
13-uger
F4A, Reeksamen aftales med underviser.
Skriftlig eksamen
4 timer
Alle hjælpemidler er tilladt
7-trins skala , intern bedømmelse
27611 og 36611
27622.27633/36633/
27002/27008 , Basal forståelse for industrielt vigtige biologiske processer. Kendskab til cellers indre struktur, deres biologiske funktioner samt biokemiske og molekylærbiologiske processer sammen med bioteknologiske processer.
Henrik Nielsen , Lyngby Campus, Bygning 204, Tlf. (+45) 4525 2098 , henni@dtu.dk
Rasmus Wernersson , Lyngby Campus, Bygning 208 , rawe@dtu.dk
22 Institut for Sundhedsteknologi
http://teaching.healthtech.dtu.dk/22111
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Computerbaserede metoder spiller i disse år en afgørende rolle indenfor molekylærbiologi, mikrobiologi, bioteknologi og lægemiddelforskning. Store internationale sekvens- og strukturdatabaser indeholder information som i mange tilfælde helt kan erstatte eksperimentelt arbejde, og i andre tilfælde bruges til at optimere udbyttet af de eksperimentelle ressourcer. Kursets mål er at således give de studerende kendskab til de vigtigste databaser og metoder til molekylær sekvens- og strukturanalyse.

Introduktion til Bioinformatik er et praktisk orienteret kursus, med fokus på anvendelse af metoderne snarere end deres matematiske udledning. Bioinformatik præsenteres som en biologisk disciplin baseret på evolutionsteori. En stor del af undervisningen består af computer-øvelser, hvor de beregningsmæssige værktøjer anvendes baseret på deltagernes biologiske forhåndskendskab.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Redegøre for hvordan informationen i biologiske makromolekyler, såsom DNA og protein, kan repræsenteres i et elektronisk format.
  • Redegøre for hvorledes en fælles evolutionshistorie påvirker DNA og protein-sekvens i beslægtede organismer.
  • Søge efter data i de offentligt tilgængelige sekvens- og struktur-databaser, såsom GenBank, UniProt og PDB.
  • Anvende programmer til visualisering af protein 3D struktur.
  • Fremstille og kritisk evaluere kvaliteten af DNA- og protein-alignments.
  • Søge i sekvensdatabaser med alignment-baserede metoder (BLAST) og kritisk evaluere pålideligheden af resultaterne.
  • Bestemme den sandsynlige biologiske funktion af et ukendt gen eller protein-produkt ud fra sammenligning med kendte gener / proteiner.
  • Anvende programmer til at fremstille multiple alignments af grupper af beslægtede sekvenser.
  • Fremstille fylogenetiske træer ud fra multiple alignments.
  • Fremstille og tolke visualiseringer af informationsindholdet i grupper af beslægtede sekvenser (“logo plots”).
Kursusindhold
Evolution på DNA-niveau. Taksonomi. Brug af taksonomi-databaser.

Biologisk information. Informationsindhold i biologiske makromolekyler. DNA sekventering – herunder fejlkilder. DNA sekvens på elektronisk form. Brug af GenBank databasen.

Proteinsekvens. Proteinstruktur-niveauer. Elektronisk repræsentation af proteinsekvens. Kilder til proteinsekvens (translation og direkte sekventering). Brug af UniProt databasen.

Proteinstruktur. Proteinstruktur bestemmelse. Kvalitet af proteinstruktur data. Brug af PDB databasen. Computerbaseret visualisering af proteinstruktur.

Parvis alignment. Alignment score, brug af "gaps", substitutions-matricer. Globalt og lokalt alignment.

BLAST. Brug af BLAST algoritmen til søgning i sekvensdatabaser. Kritisk evaluering af søgeresultater. Iterativ BLAST (PSI-BLAST).

Multiple alignments. Brug af heuristiske metoder pga. datakompleksitet.

Konstruktion og fortolking af fylogenetiske træer ud fra multiple alignments. Brug af NJ algoritmen. Rodfæstede versus ikke-rodfæstede træer.

Vægt-matrice baserede metoder. Søgning med vægt-matrice. Konstruktion og fortolkning af LOGO plots.
Litteraturhenvisninger
Udleverede noter / kompendiemateriale
Sidst opdateret
05. maj, 2020