At give indsigt i principperne bag samt fordele og ulemper ved relevante klassifikations-, forudsigelses- og modelleringsmetoder, således at den studerende kan foretage en kritisk evaluering af sådanne. Desuden at gøre den studerende i stand til på en effektiv måde at anvende bioinformatiske værktøjer fra Unix-kommandolinje til at indsamle og analysere større datamængder. Endelig at bibringe den studerende overblik til at kunne kombinere almindelige bioinformatiske værktøjer via programmering til at udgøre en sammenhængende metode.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Redegøre for principperne bag almindeligt anvendte klassifikations-, modellerings- og forudsigelsesmetoder.
Redegøre for principperne bag tekst-mining.
Fremstille mindre programmer (scripts) til at indsamle, filtrere og evaluere datasæt.
Implementere programmeringsmæssig parsing af data i tekstformat.
Sammensætte bioinformatiske værktøjer i en overordnet pipeline på Unix-kommandolinje såvel som med mindre programmer.
Evaluere kvalitet og anvendelighed af bioinformatiske værktøjer vha. almindelige performance-mål som sensitivitet, specificitet, korrelationskoefficient og ROC-kurver.
Kursusindhold:
Kurset gennemgår principperne bag de mest almindelige metoder anvendt inden for bioinformatik: kunstige neurale netværk (artificial neural networks, ANN), Markov-modeller (HMM), support-vektor maskiner (SVM) m.fl. og introducerer anvendelsen af disse metoder på relevante biologiske systemer. Desuden vises, hvorledes bioinformatiske værktøjer implementeres (installeres) og evalueres i praksis, og der lægges stor vægt på at effektivisere arbejdsprocesser med disse ved hjælp af programmering.
Mulighed for GRØN DYST deltagelse:
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk/kursustilmelding.aspx