42184 Data science og GIS inden for mobilitet

2017/2018

Kursusinformation
Data Science and GIS for Mobility
Engelsk
5
Kandidat
E2A (man 13-17)
Campus Lyngby
Forelæsninger, gruppearbejder og online undervisning (for eksempel iPython notebook og små videoforelæsninger)
13-uger
Bedømmelse af opgave(r)/rapport(er)
7-trins skala , intern bedømmelse
02402.02403.02105
Francisco Camara Pereira , Lyngby Campus, Bygning 116, Tlf. (+45) 4525 1496 , camara@dtu.dk
Ioulia Markou , Lyngby Campus, Bygning 116, Tlf. (+45) 4525 1515 , markou@dtu.dk
Thomas Ross Pedersen , Lyngby Campus, Bygning 116, Tlf. (+45) 4525 6532 , ross@dtu.dk

42 DTU Management Engineering
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Dette kursus giver et indblik i arbejdsopgaver og grundlæggende metoder, der er relevante, når man benytter data science og geografiske informations systemer (GIS) til at arbejder med mobilitetsproblemer.
Kurset indholder en introduktion til Python programmering, problemformulering, GIS databaser, data bearbejdning, basale machine learning algoritmer og GIS værktøjer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Afvikle simple Pythonscripts, der kan indlæse og analyse data
  • Opsætte problemformuleringer, der kan løses med tilgængelige dataset
  • Kunne konvertere rå data til et brugbart format, der kan benyttes til løsning
  • Tilføre basal datastruktur og algoritmer til datamanipulation
  • Udføre statistiske analyser på tilgængelige dataset
  • Visualisere komplekse rumlige forhold
  • Argumentere for den valgte analyse algoritme
  • Argumentere for de valgte rumlige værktøjer
  • Kalibrere og teste modeller med henblik på at løse opgaver
  • Evaluere datascienceanalysen kritisk
  • Producere simple kort til at illustrere og analysere data og resultater
  • Forstå komplekse koncepter, så som overfitting, bias, regularisation
Kursusindhold
Introduktion til Python programmering, regressionsmodeller (bivariate, multivariate, parametriske, ikkeparametriske), klassificering, clustering, dimensionality reduction, Geografiske informations systemer, clustering (i 2D og i flere dimensioner).

Nogle avancere emner kan også blive berørt, så som introduktion til Topic Modelling, Deep Learning eller Probabilistic Graphical Models.
Litteraturhenvisninger
Udrag fra:
"Data Science from Scratch", Joel Grus
"Python for Data Analysis", Wes McKinney
"The elements of statistical learning", Trevor Hastie, Robert Tibshirani and Jerome H. Friedman
Sidst opdateret
04. maj, 2017