Overordnede kursusmål
Formålet med kurset er at anvende open source data analyse
værktøjer på et givet problem og demonstrere samt dokumentere en
konkret anvendelse pr. projektgruppe. Eksempler på problem områder
kan være analyse af dataflow fra sociale medier, off-line analyse
af data, m.m.
På kursets første dag dannes projektgrupper omkring et antal
projekter, der besluttes i en indledende fælles kursussession med
alle deltagere. I løbet af 3-ugers kurset præsenterer
projektgrupperne derefter projektstatus i projekt seminarer. Kurset
afsluttes med et seminar hvor hver projektgruppes projekt
præsenteres og indleveres.
De anvendte værktøjer vil typisk være R, RStudio, Python, Google
CoLab, LaTeX og Beamer (LaTeX præsentationsværktøj) i et laptop
miljø.
Projektseminarerne vil bliver præsenteret via Beamer og den
afsluttende projektdokumentation vil blive udført i LaTeX.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Identificere et problemområde som bruger open source data
visualiserings og/eller analyse værktøjer under anvendelse af
mindst et værktøj til klyngeanalyse eller et værktøj til
klassifikation af data.
- Identificere, forstå og forklare én videnskabelig artikel om
metode(r) til klyngeanalyse eller klassifikation af data af
relevans for problemområdet.
- Identificere og forklare mindst tre relevante
visualiserings/analyse modeller for det valgte problemområde og
sammenligne deres forventede egenskaber i forhold til det valgte
problemområde, herunder sammenligne deres forventede krav til
beregnings- og lagrings ressourcer.
- Identificere de nødvendige visualiserings/analyse værktøjer af
relevans for de valgte modeller.
- Specificere og designe et visualiserings/analyse system under
anvendelse af én af de identificerede modeller.
- Implementere et visualiserings/analyse system, hovedsageligt
ved anvendelse af R, RStudio og/eller Python, Google CoLab.
- Verificere og demonstrere visualiserings/analyse systemet.
- Identificere og forklare de processer, der er nødvendige for at
anvende visualiserings/analysesystemet i en produktionsproces for
det relevante problemområde.
- Dokumentere det udviklede system i en rapport ved anvendelse af
LaTex og på en poster og præsentere posteren, ved anvendelse af
LaTeX Beamer.
Kursusindhold
Identificere problemstilling der anvender data visualiserings
og/eller analyse værktøjer. Identificere datatyper. Identificere
visualiserings/analyse værktøjer. Specificere, designe,
implementere og validere løsning. Identificere processer, der
kræves af et system til normal drift af løsning.
Dokumentere og posterpræsentere system.
Litteraturhenvisninger
Open source litteratur tilpasset det valgte projekt.
Sidst opdateret
11. april, 2021