62T33 Big Data

2019/2020

DTU Diplom
Valgmodul (Vf15), IT-Diplomuddannelsen
Kursusinformation
Big Data
Dansk
10
Deltidsdiplom
Kurset udbydes som enkeltfag
Campus Ballerup
Undervisning én aften om ugen kl. 17.00-20.30 over 14 uger. Opstart ultimo august og ultimo januar.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser, Eksamen planlægges af sekretariatet på DTU Learn for Life.
Mundtlig eksamen og bedømmelse af rapport(er)
7-trins skala , ekstern censur
62527
Optagelse på IT-Diplomuddannelsen forudsætter: - At ansøger har gennemført en relevant adgangsgivende uddannelse min. på niveau med en erhvervsakademiuddannelse eller en relevant videregående voksenuddannelse. - At ansøger har mindst to års erhvervserfaring efter gennemført adgangsgivende uddannelse.
Roger Munck-Fairwood , Ballerup Campus, Bygning Ballerup, Tlf. (+45) 3588 5188 , romu@dtu.dk
Jacob Nordfalk , Ballerup Campus, Bygning Ballerup , jacno@dtu.dk
62 DTU Diplom
https://www.dtu.dk/uddannelse/efteruddannelse
På instituttet
Ca. 3 uger før kursusstart
-
Overordnede kursusmål
At sætte deltagerne i stand til at anvende relevante værktøjer og metoder indenfor Big Datamiljøer og kunne reflektere over grundlaget for etablering af BigData distribueret analysemiljø i egen organisation.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Have viden om og forståelse af Big Data terminologien
  • Have viden om relevante open source programmeringssprog og statistikprogrammer og kunne reflektere over implikationerne af valg af disse
  • Have viden om grundlaget for machine learning, distribueret lagring og analyse af enorm store heterogene datasæt
  • Have forståelse af dataselektering og funktionsberegning
  • Reflektere over grundlaget for etablering af et Big Data distribueret analysemiljø
  • Begrunde, vælge, konfigurere og validere et givet analyse-/​visualiseringsproblem inden for BigData
  • Anvende relevant open source programmeringssprog til analyse og visualisering af enorme mængder af data
  • Foretage systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder herunder ikke komplette data-frames
  • På et begrundet valg anvende en dataselekterings- og funktionsmodel og tilhørende værktøjer på egne data
  • Håndtere konfigurering af eget miljø til distribueret analyse af BigData
  • På en reflekteret måde bidrage til at transformere egen virksomheds forretning på baggrund af en systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder
Kursusindhold
- Platforme til BigData-miljø
- Metoder og værktøjer til etablering af et miljø til BigData analyse, samt til planlægning og vurdering af et BigData miljø.
- Matematik til mangedimensionale data
- Datastrukturer og operationer på enorme mængder af data
- Opsamling, konvertering, scripting og oprensning af heterogene datasæt
- Introduktion til administration og vedligeholdelse af et cluster, f.eks. Linux med Hadoop.
- Visualisering af analyseresultater
- Distribuering og beregning af enorme mængder af heterogene data
Litteraturhenvisninger
https:/​/​www.polyteknisk.dk/​home/​akademi/​cv
Bemærkninger
Kurset gives i samarbejde mellem Jacob Nordfalk (50%) og John Aa. Sørensen (50%).
Sidst opdateret
26. november, 2019