Særlig dag, Eksamen 19.1.2015. Reeksamen
26.2.2015
Evalueringsform:
Eksamens varighed:
Hjælpemidler:
Bedømmelsesform:
Anbefalede forudsætninger:
,
Overordnede kursusmål:
Målet med kurset er at lære at bruge de eksisterende bioinformatik
værktøjer, forstå og vurdere tilgængelige metoder til
klassificering og forudsigelser. Fjerntliggende genetiske
databaser, som Genbank, RefSeq, UniProt mv kan tilgås af BioPython
biblioteker og web services. Vi sigter mod at udstyre de studerende
med de færdigheder til at gøre og udføre sådanne scripts til at få
adgang til eksterne databaser. Vi sigter også mod at de studerende
lærer at få adgang til, indsamle og analysere store mængder data
fra filer og databaser ved hjælp af små scripts foretaget ved hjælp
af UNIX-kommandoer. Vi sigter også mod at de studerende være i
stand til at visualisere deres data ved hjælp af R. Endelig sigter
vi mod at give indsigt i de principper og fordele og ulemper ved de
relevante klassifikationsselskaber, til forudsigelse og modellering
metoder, således at de studerende kritisk kan vurdere og
sammenligne opførelser af sådanne værktøjer .
De studerende forventes at have grundlæggende IT-færdigheder og bør
være fortrolig med programmering i Python forud for at deltage i
kurset.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Sammensætte bioinformatiske værktøjer i en overordnet pipeline
på Unix-kommandolinje såvel som med mindre programmer.
Fremstille mindre programmer (scripts) til at indsamle,
filtrdatasæt i R og at visualisere data grafisk.
Python for bioinformatiker. Implementere programmeringsmæssig
hentning af data.
Webservicer til at hentining data fra remote databaser.
Forstå principperne bag almindeligt anvendte klassifikations-,
modellerings- og forudsigelsesmetoder.
Evaluere kvalitet og anvendelighed af bioinformatiske værktøjer
vha. almindelige performance-mål som sensitivitet, specificitet,
korrelationskoefficient og ROC-kurver.
.
.
Kursusindhold:
Kurset dækker metoder til at få adgang til eksterne databaser ved
hjælp BioPython og web services og introducerer også metoder til
data manipulation og visualisering ved hjælp af Unix og R. Endelig,
kurset gennemgår principperne bag de mest almindelige metoder
anvendt inden for bioinformatik: kunstige neurale netværk
(artificial neural networks, ANN), Markov-modeller (HMM),
support-vektor maskiner (SVM) m.fl. og introducerer anvendelsen af
disse metoder på relevante biologiske systemer. Desuden vises,
hvorledes bioinformatiske værktøjer implementeres (installeres) og
evalueres i praksis, og der lægges stor vægt på at effektivisere
arbejdsprocesser med disse ved hjælp af programmering.
Litteraturhenvisninger:
online materials, papers
Mulighed for GRØN DYST deltagelse:
Kontakt underviseren for information om hvorvidt dette kursus giver
den studerende mulighed for at lave eller forberede et projekt som
kan deltage i DTUs studenterkonference om bæredygtighed,
klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk