Overordnede kursusmål
At sætte deltagerne i stand til at anvende relevante værktøjer og
metoder indenfor Big Datamiljøer og kunne reflektere over
grundlaget for etablering af BigData distribueret analysemiljø i
egen organisation.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Have viden om og forståelse af Big Data terminologien
- Have viden om relevante open source programmeringssprog og
statistikprogrammer og kunne reflektere over implikationerne af
valg af disse
- Have viden om grundlaget for machine learning, distribueret
lagring og analyse af enorm store heterogene datasæt
- Have forståelse af dataselektering og funktionsberegning
- Reflektere over grundlaget for etablering af et Big Data
distribueret analysemiljø
- Begrunde, vælge, konfigurere og validere et givet
analyse-/visualiseringsproblem inden for BigData
- Anvende relevant open source programmeringssprog til analyse og
visualisering af enorme mængder af data
- Foretage systematisk indsamling, oprensning, lagring, analyse
og rapportering af en virksomheds store heterogene datamængder
herunder ikke komplette data-frames
- På et begrundet valg anvende en dataselekterings- og
funktionsmodel og tilhørende værktøjer på egne data
- Håndtere konfigurering af eget miljø til distribueret analyse
af BigData
- På en reflekteret måde bidrage til at transformere egen
virksomheds forretning på baggrund af en systematisk indsamling,
oprensning, lagring, analyse og rapportering af en virksomheds
store heterogene datamængder
Kursusindhold
- Platforme til BigData-miljø
- Metoder og værktøjer til etablering af et miljø til BigData
analyse, samt til planlægning og vurdering af et BigData miljø.
- Matematik til mangedimensionale data
- Datastrukturer og operationer på enorme mængder af data
- Opsamling, konvertering, scripting og oprensning af heterogene
datasæt
- Introduktion til administration og vedligeholdelse af et cluster,
f.eks. Linux med Hadoop.
- Visualisering af analyseresultater
- Distribuering og beregning af enorme mængder af heterogene data
Litteraturhenvisninger
https://www.polyteknisk.dk/home/akademi/cvBemærkninger
Kurset gives i samarbejde mellem Jacob Nordfalk (50%) og John Aa.
Sørensen (50%).
Sidst opdateret
26. november, 2019