2013/2014

02803 Webbaseret tekstanalyse

Kurset udbydes online af KAIST Korea Advanced Institute of Science and Technology som en del af DTU & KAIST Cyber Dual Degree in Digital Media Engineering

Engelsk titel:

Linguistic Web Science

Sprog:

Point( ECTS )

10

Kursustype:

Kandidat
Kurset udbydes under åben uddannelse
 

Kursusperioden er fra September til December; mandag og onsdag 5PM - 6:30PM, GMT + 9 (Korea Standard Time)

Undervisningens placering:

Campus Lyngby
Kurset udbydes online fra KAIST med video link til DTU

Undervisningsform:

Online kursus bestående af forelæsninger og øvelser.

Kursets varighed:

[Kurset følger ikke DTUs normale skemastruktur]

Eksamensplacering:

Aftales med læreren

Evalueringsform:

Hjælpemidler:

Bedømmelsesform:

Overordnede kursusmål:

Internettet vokser dagligt i omfang og udgør nu det største eksisterende tekst corpus. Vi vil i kurset se på hvordan sprogteknologi kan udnytte webbaseret data til at udlede sammenhænge og definitioner baseret på tekst, for dermed at teste sproglige hypoteser i stor skala. Da internettet reflekterer hvordan sproget konstant forandres, er det muligt at analysere og modellere de essentielle kreative aspekter i tekst udfra webbaseret indhold. Der benyttes to forskellige måder til at tilgå webbaseret indhold: statiske databaser af n-grams samt dynamiske tekst queries. Kurset vil afsøge sproglige aspekter af internettet, både i forhold til indhold samt på meta niveau. Endvidere hvordan web indhold afspejler og former vores opfattelse af verdenen, samt i hvilken grad webbaseret indhold kan anvendes som fundament for kunstig intelligens i AI systemer.

Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Modellere webbaseret indhold udfra statiske tekst n-grams
  • Modellere webbaseret indhold udfra dynamiske tekst queries
  • Klassificere webbaseret indhold
  • Kategorisere webbaseret indhold
  • Anvende affektiv tekstanalyse
  • Definere taxonomi relationer
  • Kombinere koncepter i en domæne specifik ontologi
  • Implementere en semantisk web ontologi i Protege software

Kursusindhold:

IR informationssøgning, klassificering og kategorisering, affektiv tekstanalyse, kollektiv intelligens, taxonomier, og ontologier. Der indgår et individuelt midtvejsprojekt, hvor studerende får til opgave at konstruere en mindre domæne specifik semantisk web ontologi med brug af Protege software.

Kursusansvarlig:

Michael Kai Petersen , Bygning 321, rum 128, Tlf. (+45) 4525 5227 , mkai@dtu.dk
Tony Veale , tony.veale@gmail.com

Institut:

01 Institut for Matematik og Computer Science

Ekstern samarbejdsinstitution:

KAIST Korea Advanced Institute ofScience and Technology

Tilmelding:

I CampusNet
Sidst opdateret: 02. maj, 2013