42184 Data science inden for mobilitet

2022/2023

Kursusinformation
Data Science for Mobility
Engelsk
5
Kandidat
E1A (man 8-12)
Campus Lyngby
Forelæsninger, gruppearbejde og online undervisning (for eksempel iPython notebook)
13-uger
Bedømmelse af opgave(r)/rapport(er)
Evalueringen er baseret på en quiz (kodnings- og datamodelleringsøvelser i Jupyter-notesbogen - 40 % af den samlede karakter) og et gruppeprojekt (60 % af den samlede karakter).
7-trins skala , intern bedømmelse
42577
42577 Introduktion til Business Analytics
02402/02403/02105 , Indledende kurser i statistik er meget vigtige (programmering er også meget brugbart, men ikke grundlæggende)
Filipe M Pereira Duarte Rodrigues , Lyngby Campus, Bygning 358, Tlf. (+45) 4525 6530 , rodr@dtu.dk
Francisco Camara Pereira , Lyngby Campus, Bygning 358, Tlf. (+45) 4525 1496 , camara@dtu.dk
Ravi Seshadri , ravse@dtu.dk
Guido Cantelmo , guica@dtu.dk
42 Institut for Teknologi, Ledelse og Økonomi
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Dette kursus introducerer den portefølje af datavidenskabelige opgaver og teknikker, der er nødvendige for at udforske, manipulere, visualisere og analysere data (deskriptiv analyse) samt for at opbygge forudsigelsesmodeller ved hjælp af maskinlæring (prædiktiv analyse), der kan bruges til at opnå indsigt og støtte beslutninger (præskriptiv analyse). Den er udviklet med henblik på, at studerende inden for Management Engineering (dvs. en vis programmeringsbaggrund, men ikke den centrale færdighed), især - men ikke udelukkende - studerende med relation til studier inden for mobilitet og logistik og virksomhedsanalyse. Derfor indeholder den en stærk praktisk komponent med specifikke cases fra den virkelige verden omkring mobilitets- og forretningssammenhænge.

Kurset omfatter også en introduktion til Python-programmering, databehandling, problemformulering og den grundlæggende pakke af maskinlæringsalgoritmer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Køre Python-scripts, der indlæser og analyserer små/mellemstore datasæt
  • Konvertere et rådatasæt til en handlingsmæssig form for at løse et konkret problem
  • Anvende grundlæggende datastrukturer og algoritmer til at manipulere data
  • Relatere tilgængelige problemer og data i en mobilitets-/​forretningsanalysekontekst med teknikker til at løse dem
  • Udtrække og analysere indsigter fra anvendelsen af metoder til beskrivende og prædiktive analyser
  • Visualisere komplekse tidsmæssige og rumlige mønstre
  • Argumentere for valget af hensigtsmæssige algoritmer til dataanalyse og forudsigelsesanalyser
  • At træne og teste en statistisk model på passende vis for at besvare et problem
  • Kritisk vurdere resultaterne af en datavidenskabelig analyse og anbefalede handlinger
  • Forklare vigtige begreber inden for datamining, f.eks. overfitting, bias, regularisering osv.
Kursusindhold
Undervisningen foregår på en interaktiv måde med teoretiske dele, der kombineres med øvelse i brugen af Jupyter Notebooks.

De vigtigste emner er: Introduktion til Python-programmering og Pandas, datavisualisering, prognose- og regressionsmodeller, klassifikation, clustering, dimensionalitetsreduktion. Metoderne vil blive eksemplificeret gennem forskellige cases inden for f.eks. transport, ledelse og markedsføring.
Litteraturhenvisninger
Hver forelæsning har sine egne anbefalede tekster, som vil være offentlig tilgængelige online. For den studerende, der er interesseret i at følge en bog, anbefaler vi "The elements of statistical learning", Trevor Hastie, Robert Tibshirani og Jerome H. Friedman "Python for Data Analysis", Wes McKinney
Sidst opdateret
06. juli, 2022