Kursets formål er at gøre de studerende i stand til at visualisere
komplekse datasæt og anvende de mest brugte strategier for at
evaluere følelser og humør i medier (fx tekst, musik, billeder,
osv). Den studerende vil kunne anvende og evaluere simple machine
learning teknikker (fx ikke-negativ matrix faktorisering, dokument
klassifikation, decision trees). Medier beskrives via features
dannet udfra højniveau programmeringssprog og APIer. Kurset giver
en konceptuel basis for at kunne modellere sociale data.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Evaluere og tilgå forskellige typer af online data til brug for
datavisualisering.
Definere fundamentale principper for præsentation af visuel
information
Anvende principperne for præsentation af visuel information til
at danne visualiseringer af komplekse datasæt.
Forklare og evaluere de mest brugte mål for similaritet mellem
objekter og brugere; bruge similariteterne til at danne
meningsfulde grupperinger.
Implementere kollaborativ filtrering til personalisering af
indhold.
Anvende non-negativ matrix faktorisering til at udlede
uafhængige features fra medier.
Anvende dokumentklassifikation til at kategorisere og analysere
inholdet af sociale datasæt - og evaluere resultaterne.
Anvende decision trees til at udlede underliggende mønstre i
adfæren fra sociale datasæt og evaluere
resultaterne.
Kursusindhold:
Kurset er baseret på at beherske værktøjer til at analysere
datasæt dannet på baggrund af online sociale interaktioner. Kurset
er struktureret omkring korte forelæsninger kombineret med
praktiske øvelser, samt en høj grad af selvstændigt
projektarbejde.
Mulighed for GRØN DYST deltagelse:
Kontakt underviseren for information om hvorvidt dette kursus giver
den studerende mulighed for at lave eller forberede et projekt som
kan deltage i DTUs studenterkonference om bæredygtighed,
klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk