62T33 Big Data

2020/2021

DTU Diplom
Valgmodul (Vf15), IT-Diplomuddannelsen
Kursusinformation
Big Data
Dansk
10
Deltidsdiplom
Kurset udbydes som enkeltfag
Campus Ballerup
Undervisning én aften om ugen kl. 17.00-20.30 over 13 uger. Opstart ultimo august/primo sep. og ultimo januar/primo feb.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser, Eksamen planlægges af sekretariatet på DTU Learn for Life.
Mundtlig eksamen og bedømmelse af rapport(er)
7-trins skala , ekstern censur
62527
Optagelse på IT-Diplomuddannelsen forudsætter: - At ansøger har gennemført en relevant adgangsgivende uddannelse min. på niveau med en erhvervsakademiuddannelse eller en relevant videregående voksenuddannelse. - At ansøger har mindst to års erhvervserfaring efter gennemført adgangsgivende uddannelse.
Roger Munck-Fairwood , Ballerup Campus, Bygning Ballerup , romu@dtu.dk
Jacob Nordfalk (Primær kontaktperson)
John Aasted Sørensen , Ballerup Campus, Bygning Ballerup , jaas@dtu.dk
62 Institut for Ingeniørteknologi og -didaktik
https://www.dtu.dk/uddannelse/efteruddannelse
På instituttet
Ca. 3 uger før kursusstart
Overordnede kursusmål
At sætte deltagerne i stand til at anvende relevante værktøjer og metoder indenfor Big Datamiljøer og kunne reflektere over grundlaget for etablering af BigData distribueret analysemiljø i egen organisation.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Have viden om og forståelse af Big Data terminologien.
  • Have viden om relevante open source programmeringssprog og statistikprogrammer og kunne reflektere over implikationerne af valg af disse.
  • Have viden om grundlaget for machine learning, distribueret lagring og analyse af enorm store heterogene datasæt.
  • Have forståelse af dataselektering og funktionsberegning.
  • Reflektere over grundlaget for etablering af et Big Data distribueret analysemiljø.
  • Begrunde, vælge, konfigurere og validere et givet analyse-/​visualiseringsproblem inden for Big Data.
  • Anvende relevant open source programmeringssprog til analyse og visualisering af enorme mængder af data
  • Foretage systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder herunder ikke komplette data-frames.
  • På et begrundet valg anvende en dataselekterings- og funktionsmodel og tilhørende værktøjer på egne data.
  • Håndtere konfigurering af eget miljø til distribueret analyse af BigData
  • På en reflekteret måde bidrage til at transformere egen virksomheds forretning på baggrund af en systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder
Kursusindhold
- Platforme til BigData-miljø
- Metoder og værktøjer til etablering af et miljø til BigData analyse, samt til planlægning og vurdering af et BigData miljø.
- Matematik til mangedimensionale data
- Datastrukturer og operationer på enorme mængder af data
- Opsamling, konvertering, scripting og oprensning af heterogene datasæt
- Introduktion til administration og vedligeholdelse af et cluster, f.eks. Linux med Hadoop.
- Visualisering af analyseresultater
- Distribuering og beregning af enorme mængder af heterogene data
Litteraturhenvisninger
https:/​/​www.polyteknisk.dk/​home/​akademi/​cv
Bemærkninger
Kurset gives i samarbejde mellem Jacob Nordfalk (50%) og John Aa. Sørensen (50%).
Sidst opdateret
07. maj, 2020