Kurset udbydes online af KAIST Korea Advanced
Institute of Science and Technology som en del af DTU & KAIST
Cyber Dual Degree in Digital Media Engineering
Engelsk titel:
Linguistic Web Science
Sprog:
Point( ECTS )
10
Kursustype:
Kandidat
Kurset udbydes under åben uddannelse
Kursusperioden er fra September til December; mandag og onsdag
5PM - 6:30PM, GMT + 9 (Korea Standard Time)
Undervisningens placering:
Campus Lyngby
Kurset udbydes online fra KAIST med video link til
DTU
Undervisningsform:
Online kursus bestående af forelæsninger og øvelser.
Internettet vokser dagligt i omfang og udgør nu det største
eksisterende tekst corpus. Vi vil i kurset se på hvordan
sprogteknologi kan udnytte webbaseret data til at udlede
sammenhænge og definitioner baseret på tekst, for dermed at teste
sproglige hypoteser i stor skala. Da internettet reflekterer
hvordan sproget konstant forandres, er det muligt at analysere og
modellere de essentielle kreative aspekter i tekst udfra webbaseret
indhold. Der benyttes to forskellige måder til at tilgå webbaseret
indhold: statiske databaser af n-grams samt dynamiske tekst
queries. Kurset vil afsøge sproglige aspekter af internettet, både
i forhold til indhold samt på meta niveau. Endvidere hvordan web
indhold afspejler og former vores opfattelse af verdenen, samt i
hvilken grad webbaseret indhold kan anvendes som fundament for
kunstig intelligens i AI systemer.
Læringsmål:
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
Modellere webbaseret indhold udfra statiske tekst n-grams
Modellere webbaseret indhold udfra dynamiske tekst queries
Klassificere webbaseret indhold
Kategorisere webbaseret indhold
Anvende affektiv tekstanalyse
Definere taxonomi relationer
Kombinere koncepter i en domæne specifik ontologi
Implementere en semantisk web ontologi i Protege
software
Kursusindhold:
IR informationssøgning, klassificering og kategorisering, affektiv
tekstanalyse, kollektiv intelligens, taxonomier, og ontologier. Der
indgår et individuelt midtvejsprojekt, hvor studerende får til
opgave at konstruere en mindre domæne specifik semantisk web
ontologi med brug af Protege software.