42184 Data science og GIS inden for mobilitet

2018/2019

Kursusinformation
Data Science and GIS for Mobility
Engelsk
5
Kandidat
E2A (man 13-17)
Campus Lyngby
Forelæsninger, gruppearbejder og online undervisning (for eksempel iPython notebook og små videoforelæsninger)
13-uger
Bedømmelse af opgave(r)/rapport(er)
7-trins skala , intern bedømmelse
02402/02403/02105
Francisco Camara Pereira , Lyngby Campus, Bygning 116, Tlf. (+45) 4525 1496 , camara@dtu.dk
Ioulia Markou , Tlf. (+45) 4525 51515 , s160556@student.dtu.dk
Thomas Ross Pedersen , Lyngby Campus, Bygning 116, Tlf. (+45) 4525 6532 , ross@dtu.dk
Susanne Rieneck Pedersen , Lyngby Campus, Bygning 116, Tlf. (+45) 4525 1516 , surp@dtu.dk

42 Institut for Systemer, Produktion og Ledelse
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Dette kursus introducerer en portefølje af opgaver og teknikker, der er nødvendige for at kunne anvende Datavidenskab til mobilitetsproblemer. Kurset er designet med Management Engineering studerende i tankerne, (dvs. man har programmeringsbaggrund, men ikke som kerne kompetence), især - men ikke udelukkende - det, der relaterer til studier om mobilitet og logistik.

Kurset indeholder en introduktion til Python programmering, data bearbejdning, problemformulering, Spatial statistik og den grundlæggende pakke af maskinlæring og spatiale databehandlingsalgoritmer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Afvikle simple Pythonscripts, der kan indlæse og analyse data
  • Effektivt kunne relatere tilgængelige problemer og data, især i mobilitet med teknikker til at tackle disse.
  • Kunne konvertere rå data til et brugbart format, der kan benyttes til løsning
  • Tilføre basal datastruktur og algoritmer til datamanipulation
  • Udføre statistiske analyser på tilgængelige dataset
  • Effektivt visualisere komplekse rumlige og temporale mønstre
  • Argumentere for den valgte analyse algoritme
  • Argumentere for de valgte rumlige værktøjer
  • Kalibrere og teste modeller med henblik på at løse opgaver
  • Evaluere datascienceanalysen kritisk
  • Producere simple kort til at illustrere og analysere data og resultater
  • Forstå komplekse koncepter, så som overfitting, bias, regularisation
Kursusindhold
Klasserne undervises interaktivt, med det teoretiske indhold blandet med det praktiske ved hjælp af Jupyter Notebooks.

Hovedemner: Introduktion til Python programmering, regressionsmodeller (bivariate, multivariate, parametriske, ikkeparametriske), klassificering, clustering, dimensionality reduction, Geografiske informations systemer, clustering (i 2D og i flere dimensioner).

I løbet af kursets fremdrift vil nogle avancere emner også blive berørt, så som introduktion til Topic Modelling, Deep Learning eller Probabilistic Graphical Models.

Dette kursus udvikles løbende i samarbejde med MIT kursus 1.074 (http:/​/​catalog.mit.edu/​subjects/​1/​)
Litteraturhenvisninger
Udrag fra:
"Data Science from Scratch", Joel Grus
"Python for Data Analysis", Wes McKinney
"The elements of statistical learning", Trevor Hastie, Robert Tibshirani and Jerome H. Friedman
Sidst opdateret
01. maj, 2018