27411 Biologisk dataanalyse og kemometri

2016/2017

Kursusinformation
Biological data analysis and chemometrics
Engelsk
5
Kandidat
Kurset udbydes under tompladsordningen
F2A (man 13-17)
Campus Lyngby
Forelæsninger, arbejde med PC (multivariate statistik programmer)
13-uger
F2A
Mundtlig eksamen
uden forberedelsestid
Uden hjælpemidler
7-trins skala , ekstern censur
27511
27511
02402 , Forståelse for statistisk tankegang og metoder. Forståelse af tilfældig variation og af brugen af statistiske modeller herfor. Forståelse for vigtige statistiske principper for indsamling og undersøgelse af data, herunder metoder for valg af en egnet model for data, estimation, testning og verifikation af valgt model. Behandle enkle problemer, som forekommer hyppigt i ingeniørmæssig praksis og derved være i stand til at vurdere og forholde sig kritisk til statistiske (empiriske) undersøgelser og kilder.
Minimum 15
Jens Christian Frisvad , Lyngby Campus, Bygning 221, Tlf. (+45) 4525 2626 , jcf@bio.dtu.dk
Per B. Brockhoff , Lyngby Campus, Bygning 324, Tlf. (+45) 4525 3365 , perbb@dtu.dk

27 Institut for Systembiologi
01 Institut for Matematik og Computer Science
http://27411.compute.dtu.dk/
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Efter kurset har du erfaring i at anvende de gængse kemometriske metoder, der bruges i alle biologiske og kemiske discipliner, hvor der bruges avanceret spektrometriske og andre fysiske/kemiske målemetoder. Kemometri bruges i stort og stigende omfang i grundvidenskabelige fag og i industrielle virksomheder.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Give en oversigt over vigtige kemometriske metoder.
  • Identificere situationer hvor man bør bruge eksplorativ dataanalyse.
  • Beskrive og bruge forskellige former for skalering, transformering og normalisering af data.
  • Forstå og beskrive forskellen mellem klassifikation og regression.
  • Forstå og beskrive forskellen mellem klustering og ordination.
  • Anvende og fortolke principal komponent analyse (PCA) på multivariate data.
  • Anvende og fortolke principperne i validering og outlier bestemmelse.
  • Bruge og fortolke kluster analyse på multivariate data.
  • Beskrive, anvende og fortolke multiple linear regression (MLR) og ridge regression (RR) og hvor disse metoder kan anvendes i to matrice problemer.
  • Beskrive, anvende og fortolke principal component regression (PCR) og partial least squares regression (PLSR) og hvor disse metoder kan anvendes i to matrice problemer.
  • Anvende og fortolke korrespondance analyse.
  • Beskrive metoden metrisk multidimensionel skalering.
Kursusindhold
Multivariat behandling af kvantitative og kvalitative datamatricer. Eksplorativ dataanalyse, regressions- og klassifikationsmetoder. Skalering og standardisering af rådata. Klusteranalyse og ordination (egenværdianalyser). Principal komponent analyse, principal komponent regression, partial least square regression, principal koordinat analyse og korrespondence analyse. Validering af data, specielt krydsvalidering og jack-knifing. Anvendelse af plots i evaluering af data. Specielle problemstillinger ved biologiske, bioteknologiske og kemiske data.
Sidst opdateret
08. december, 2016