Formålet med dette kursus er at introducere deltagerne for typer af
data og metoder til at sammenligne mikrobielle genomsekvenser med
specielt fokus på bioteknologisk relevante svampe. I takt med at
flere mikroorganismer bliver genomsekventeret bliver der et større
behov for analysemetoder, der kan inkorporere forskellige typer
data i bioteknologisk udvikling. Forskellige datatyper (genomics,
proteomics, transcriptomics) kan bidrage til identifikation af
target gener til udvikling af effektive produktionsstammer eller
produktion af bioaktive stoffer.
Dette kursus består af tre forskellige komponenter, der vil udstyre
deltagerne med værktøjer til avanceret dataanalyse af mikrobielle
-omics data.
1) Kendskab til forskellige dataressourcer og hvordan data
indhentes fra disse
- databaser af sekvensdata, annoteringer og eksperimentelle data
- datatyper såsom domæner, manuelt inspicerede annoteringer såsom
enzyme class numbers (EC) og sekvensbaseret data som DNA, proteins,
transcriptome og proteom-data
- web-download R-moduler
2) Metoder til sammenligning af genomsekvenser og relatering til
bioteknologiske problemstillinger
- simple sekvensmønstre, størrelse, aminosyreprofiler, kodon brug,
gendensitet og GC-indhold
- sammenligning af annoteringer, såsom sekundær metabolisme,
domæner og synteseveje
- kvantitativ sammenligning, beskrivende statistik,
distancematricer og hierarkisk gruppering
3) Designe og præsentere et datadrevet projekt i tekst og
præsentation
- formuler et videnskabeligt spørgsmål eller en hypotese og
identificere, hvilken type data der er nødvendig for at belyse
disse
- præsentation af datadrevet projekt ved brug af beskrivende tal og
figurer
Datasæt og forslag til hypoteser og fokusområder vil blive
udleveret på kurset og vil bestå af genomsekvenser fra forskellige
bakterier og mikroskopiske svampe. Metoderne fra dette kursus vil
være brugbare i analyse af pro- og eukaryote genomsekvenser
generelt.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Beskrive metoder til at sammenligne mikrobielle genomer
Liste offentlige databaser hvor -omic data er tilgængeligt og
beskrive hver data type og i hvilken biologisk sammenhæng det kan
bruges
Relatere forskellige typer biologiske data til hinanden
Sammenligne genomsekvensdata på tværs af arter
Designe et workflow der muligører import of visualisering af
genomsekvensdata i R/RStudio
Beskrive genomsekvensdata i informative tal og figurer
Forklare dataresultater og hypoteser baseret på
dataanalyse
Bestemme en passende visualiseringsform for en bestemt type
data i R/RStudio
Kursusindhold:
Dataressourcer og typer
R/RStudio, komparative analyse metoder og visualisering
Beskrivende dataanalyse
Projektarbejde i grupper, dataindsamling, analyse og præsentation
Rapportskrivning i grupper, hypotese og opgaveformulering, design
af metode til dataanalyse, præsentation