Overordnede kursusmål
Dette kursus introducerer den portefølje af datavidenskabelige
opgaver og teknikker, der er nødvendige for at udforske,
manipulere, visualisere og analysere data (deskriptiv analyse) samt
for at opbygge forudsigelsesmodeller ved hjælp af maskinlæring
(prædiktiv analyse), der kan bruges til at opnå indsigt og støtte
beslutninger (præskriptiv analyse). Den er udviklet med henblik på,
at studerende inden for Management Engineering (dvs. en vis
programmeringsbaggrund, men ikke den centrale færdighed), især -
men ikke udelukkende - studerende med relation til studier inden
for mobilitet og logistik og virksomhedsanalyse. Derfor indeholder
den en stærk praktisk komponent med specifikke cases fra den
virkelige verden omkring mobilitets- og forretningssammenhænge.
Kurset omfatter også en introduktion til Python-programmering,
databehandling, problemformulering og den grundlæggende pakke af
maskinlæringsalgoritmer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Køre Python-scripts, der indlæser og analyserer små/mellemstore
datasæt
- Konvertere et rådatasæt til en handlingsmæssig form for at løse
et konkret problem
- Anvende grundlæggende datastrukturer og algoritmer til at
manipulere data
- Relatere tilgængelige problemer og data i en
mobilitets-/forretningsanalysekontekst med teknikker til at løse
dem
- Udtrække og analysere indsigter fra anvendelsen af metoder til
beskrivende og prædiktive analyser
- Visualisere komplekse tidsmæssige og rumlige mønstre
- Argumentere for valget af hensigtsmæssige algoritmer til
dataanalyse og forudsigelsesanalyser
- At træne og teste en statistisk model på passende vis for at
besvare et problem
- Kritisk vurdere resultaterne af en datavidenskabelig analyse og
anbefalede handlinger
- Forklare vigtige begreber inden for datamining, f.eks.
overfitting, bias, regularisering osv.
Kursusindhold
Undervisningen foregår på en interaktiv måde med teoretiske dele,
der kombineres med øvelse i brugen af Jupyter Notebooks.
De vigtigste emner er: Introduktion til Python-programmering og
Pandas, datavisualisering, prognose- og regressionsmodeller,
klassifikation, clustering, dimensionalitetsreduktion. Metoderne
vil blive eksemplificeret gennem forskellige cases inden for f.eks.
transport, ledelse og markedsføring.
Litteraturhenvisninger
Hver forelæsning har sine egne anbefalede tekster, som vil være
offentlig tilgængelige online. For den studerende, der er
interesseret i at følge en bog, anbefaler vi "The elements of
statistical learning", Trevor Hastie, Robert Tibshirani og
Jerome H. Friedman "Python for Data Analysis", Wes
McKinney
Sidst opdateret
06. juli, 2022