Overordnede kursusmål
Dette kursus introducerer en portefølje af opgaver og teknikker,
der er nødvendige for at kunne anvende Datavidenskab til
mobilitetsproblemer. Kurset er designet med Management Engineering
studerende i tankerne, (dvs. man har programmeringsbaggrund, men
ikke som kerne kompetence), især - men ikke udelukkende - det, der
relaterer til studier om mobilitet og logistik.
Kurset indeholder en introduktion til Python programmering, data
bearbejdning, problemformulering, Spatial statistik og den
grundlæggende pakke af maskinlæring og spatiale
databehandlingsalgoritmer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Afvikle simple Pythonscripts, der kan indlæse og analyse
data
- Effektivt kunne relatere tilgængelige problemer og data, især i
mobilitet med teknikker til at tackle disse.
- Kunne konvertere rå data til et brugbart format, der kan
benyttes til løsning
- Tilføre basal datastruktur og algoritmer til
datamanipulation
- Udføre statistiske analyser på tilgængelige dataset
- Effektivt visualisere komplekse rumlige og temporale
mønstre
- Argumentere for den valgte analyse algoritme
- Argumentere for de valgte rumlige værktøjer
- Kalibrere og teste modeller med henblik på at løse opgaver
- Evaluere datascienceanalysen kritisk
- Producere simple kort til at illustrere og analysere data og
resultater
- Forstå komplekse koncepter, så som overfitting, bias,
regularisation
Kursusindhold
Klasserne undervises interaktivt, med det teoretiske indhold
blandet med det praktiske ved hjælp af Jupyter Notebooks.
Hovedemner: Introduktion til Python programmering,
regressionsmodeller (bivariate, multivariate, parametriske,
ikkeparametriske), klassificering, clustering, dimensionality
reduction, Geografiske informations systemer, clustering (i 2D og i
flere dimensioner).
I løbet af kursets fremdrift vil nogle avancere emner også blive
berørt, så som introduktion til Topic Modelling, Deep Learning
eller Probabilistic Graphical Models.
Dette kursus udvikles løbende i samarbejde med MIT kursus 1.074
(
http://catalog.mit.edu/subjects/1/)
Litteraturhenvisninger
Udrag fra:
"Data Science from Scratch", Joel Grus
"Python for Data Analysis", Wes McKinney
"The elements of statistical learning", Trevor Hastie,
Robert Tibshirani and Jerome H. Friedman
Sidst opdateret
01. maj, 2018