02807 Beregningsmæssige Værktøjer til Datavidenskab

2022/2023

Kursusinformation
Computational Tools for Data Science
Engelsk
5
Kandidat
Kurset udbydes som enkeltfag
E7 (tirs 18-22)
Campus Lyngby
Forelæsninger, opgaveregning og projektarbejde.
13-uger
E7, Ingen eksamen
Bedømmelse af øvelser og rapport(er)
Bedømmelsen af rapporter er baseret på individualiserede grupperapporter.
7-trins skala , intern bedømmelse
Solid programmeringserfaring. Minimum et kursus i programmering plus yderligere erfaring fra et andet kursus eller programmeringsprojekt. Kurset bruger Python. Der forventes, at deltagerne har (basal) kendskab til Python. Tutorials findes på nettet, for eksempel https:/​/​docs.python.org/​3/​tutorial/​. Der er kun en kort brush-up i starten.
Minimum 20
Paul Fischer , Lyngby Campus, Bygning 322, Tlf. (+45) 4525 3713 , pafi@dtu.dk
David Earl Roberson (Primær kontaktperson) , Lyngby Campus, Bygning 322 , dero@dtu.dk
Karl Magnus Heuer , Lyngby Campus, Bygning 322, Tlf. (+45) 4525 3645 , karheu@dtu.dk
01 Institut for Matematik og Computer Science
http://courses.compute.dtu.dk/02807/
I studieplanlæggeren
Dette kursus giver den studerende en mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
Dette kursus giver en kort og intensiv introduktion til beregningsberegningsmæssige værktøjer og teknikker til at håndtere store datamængder. Fokus er på praktisk erfaring.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Vælge eller udvikle algoritmer til specifikke data science anvendelser.
  • Sammenligne, evaluere og anvende teknologier for parallelle og distribuerede algoritmer.
  • Implementere algoritmer for data science og anvende dem på problemer fra den virkelige verden.
  • Sammenligne, evaluere og anvende beregningsberegningsmæssige værktøjer og teknikker for massive datamængder.
  • Finde, undersøge og evaluere relevant teknologier og litteratur relateret til beregningsmæssige værktøjer og teknikker for massive datamængder.
  • Kombinere beregningsmæssige værktøjer og teknikker for massive datamængder.
  • Analysere skalerbarhed af beregningsmæssige værktøjer og teknikker for massive datamængder.
  • Argumentere klart for valg i forbindelse med design og udvikling af løsninger.
Kursusindhold
Beregningsmæssige værktøjer og teknikker til at håndtere massive data mængder.
Litteraturhenvisninger
Mining of Massive Datasets;
Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman;
Cambridge University Press, 2020; 3rd. edt.;
isbn: 9781108476348.
Online: http://www.mmds.org/
Sidst opdateret
04. august, 2022