2015/2016

62T33 Big Data

Valgmodul, IT-Diplomuddannelsen

Engelsk titel:

Big Data

Sprog:

Point( ECTS )

10

Kursustype:

Deltidsdiplom
Kurset udbydes under tompladsordningen
 

Undervisningens placering:

Campus Ballerup

Kursets varighed:

[Kurset følger ikke DTUs normale skemastruktur]

Eksamensplacering:

Aftales med underviser, Oplyses på CampusNet

Evalueringsform:

Bedømmelsesform:

Pointspærring:

Obligatoriske forudsætninger:

Overordnede kursusmål:

At sætte deltagerne i stand til at anvende relevante værktøjer og metoder indenfor Big Datamiljøer og kunne reflektere over grundlaget for etablering af BigData distribueret analysemiljø i egen organisation

Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Viden om og forståelse af Big Data terminologien
  • Viden om relevante open source programmeringssprog og statistikprogrammer og kunne reflektere over implikationerne af valg af disse
  • Viden om grundlaget for machine learning, distribueret lagring og analyse af enorm store heterogene datasæt
  • Forståelse af dataselektering og funktionsberegning
  • Reflektere over grundlaget for etablering af et Big Data distribueret analysemiljø
  • Kan begrunde, vælge, konfigurere og validere et givet analyse-/​visualiseringsproblem inden for BigData
  • Kan anvende relevant open source programmeringssprog til analyse og visualisering af enorme mængder af data
  • Kan foretage systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder herunder ikke komplette data-frames
  • Kan på et begrundet valg anvende en dataselekterings- og funktionsmodel og tilhørende værktøjer på egne data
  • Kan håndtere konfigurering af eget miljø til distribueret analyse af BigData
  • Kan på en reflekteret måde bidrage til at transformere egen virksomheds forretning på baggrund af en systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder

Kursusindhold:

- Platforme til BigData-miljø
- Metoder og værktøjer til etablering af et miljø til BigData analyse, samt til planlægning og vurdering af et BigData miljø.
- Matematik til mangedimensionale data
- Datastrukturer og operationer på enorme mængder af data
- Opsamling, konvertering, scripting og oprensning af heterogene datasæt
- Introduktion til administration og vedligeholdelse af et cluster, f.eks. Linux med Hadoop.
- Visualisering af analyseresultater
- Distribuering og beregning af enorme mængder af heterogene data

Litteraturhenvisninger:

Se www.cv.diplom.dtu.dk

Kursusansvarlig:

Roger Munck-Fairwood , Ballerup Campus, Bygning Ballerup, Tlf. (+45) 3588 5188 , romu@dtu.dk

Institut:

62 DTU Diplom

Kursushjemmeside:

Se www.cv.diplom.dtu.dk

Tilmelding:

På instituttet
Ca. 3 uger før kursusstart
http:/​/​www.cv.diplom.dtu.dk/​Diplomuddannelser/​IT-Diplomuddannelsen
Sidst opdateret: 09. december, 2015