42588 Data og data science

2024/2025

Obligatorisk kursus for BSc'en i Data Science og Management. Forbeholdt disse studerende.
Kursusinformation
Data and data science
Dansk
5
Bachelor
Projekter og almene fag, BSc i Data Science og Management
Retningsspecifikt kursus (BSc), Data Science og Management
F5B (ons 13-17)
Campus Lyngby
Forelæsninger, øvelser, diskussion og projekter.
13-uger
F5B
Mundtlig eksamen og bedømmelse af opgave(r)
Evalueringen er baseret på tre gruppeprojekter og en mundtlig eksamen som evalueres samlet.
7-trins skala , intern bedømmelse
(02402/02403).­0245042580
Stefan Eriksen Mabit , Lyngby Campus, Bygning 358, Tlf. (+45) 4525 1510 , smab@dtu.dk
Jeppe Rich , Lyngby Campus, Bygning 358, Tlf. (+45) 4525 1536 , rich@dtu.dk
Anders Kristian Munk , ankm@dtu.dk
42 Institut for Teknologi, Ledelse og Økonomi
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Kurset handler om de udfordringer, som opstår når man forsøger at besvare spørgsmål vha. data og forskellige tilgange til at løse disse udfordringer. Kursets hovedemne er derfor data, og dækker viden om forskellige typer af data og måder at indsamle og behandle data. Kurset introducerer forskellige tilgange til deskriptiv analyse, datavisualisering og -analyse. Kurset har også som formål at give de studerende et overblik over forskellige skoler inden for statistik og data science, som alle bidrager med forskellige tilgange til at besvare spørgsmål vha. data f.eks. statistisk analyse vs. machine learning og eksplorativ vs. konfirmatorisk datavisualisering.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • diskutere forholdet mellem problemstilling, metode og data
  • beskrive forskellige typer af data og dataindsamling
  • diskutere data governance og producere en data management plan
  • diskutere og anvende værktøjer til databehandling
  • benytte data til at besvare relevante spørgsmål
  • foretage en deskriptiv analyse og visualisere data
  • diskutere forskellen mellem forskellige tilgange til statistik/data science
  • anvende standardmetoder til analyse af kontinuerte data og fortolke resultater
  • anvende standardmetoder til analyse af diskrete data og fortolke resultater
  • anvende standardmetoder til analyse af tekstuelle data og fortolke resultater
  • præsentere fokuserede og koncise dataanalyser
Kursusindhold
Kurset præsenterer generelle aspekter af data og dataindsamling. Samtidig giver det en introduktion til de forskellige datakategorier og deres kendetegn f.eks. observationsdata, hypotetiske data og dataindsamling via surveys, eksperimentelle data og realtidsdata. Kurset omhandler også governance f.eks. data management plans, GDPR og FAIR. I kurset skal de studerende løbende afprøve de forskellige værktøjer på forskellige datasæt, så de kan opbygge en forståelse af de udfordringer, der følger med databehandling (og hvor tidskrævende det er). Den sidste del af kurset omhandler dataanalyse og indeholder emner som deskriptiv statistik, data scraping, sprogteknologi, visualisering, regressions- og klassifikationsmodeller.
Litteraturhenvisninger
Kurset benytter
- James, Witten, Hastie, Tibshirani, Taylor (2023) An Introduction to Statistical Learning: with Applications in Python. https:/​​/​​findit.dtu.dk/​​en/​​catalog/​​64f4119c68cc5422d030e2e9.

Yderligere litteratur videregives i løbet af kurset.
Sidst opdateret
16. september, 2024