Overordnede kursusmål
Dette kursus giver et indblik i arbejdsopgaver og grundlæggende
metoder, der er relevante, når man benytter data science og
geografiske informations systemer (GIS) til at arbejder med
mobilitetsproblemer.
Kurset indholder en introduktion til Python programmering,
problemformulering, GIS databaser, data bearbejdning, basale
machine learning algoritmer og GIS værktøjer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Afvikle simple Pythonscripts, der kan indlæse og analyse
data
- Opsætte problemformuleringer, der kan løses med tilgængelige
dataset
- Kunne konvertere rå data til et brugbart format, der kan
benyttes til løsning
- Tilføre basal datastruktur og algoritmer til
datamanipulation
- Udføre statistiske analyser på tilgængelige dataset
- Visualisere komplekse rumlige forhold
- Argumentere for den valgte analyse algoritme
- Argumentere for de valgte rumlige værktøjer
- Kalibrere og teste modeller med henblik på at løse opgaver
- Evaluere datascienceanalysen kritisk
- Producere simple kort til at illustrere og analysere data og
resultater
- Forstå komplekse koncepter, så som overfitting, bias,
regularisation
Kursusindhold
Introduktion til Python programmering, regressionsmodeller
(bivariate, multivariate, parametriske, ikkeparametriske),
klassificering, clustering, dimensionality reduction, Geografiske
informations systemer, clustering (i 2D og i flere dimensioner).
Nogle avancere emner kan også blive berørt, så som introduktion til
Topic Modelling, Deep Learning eller Probabilistic Graphical
Models.
Litteraturhenvisninger
Udrag fra:
"Data Science from Scratch", Joel Grus
"Python for Data Analysis", Wes McKinney
"The elements of statistical learning", Trevor Hastie,
Robert Tibshirani and Jerome H. Friedman
Sidst opdateret
04. maj, 2017