810630 :Taaltechnologie

Algemeen

Voertaal Nederlands
Werkvorm: 12 x 2 uur werkcollege (Geen informatie over collegetijden bekend)
Tentamenvorm: Enkele opdrachten en Open-boek tentamen (Geen informatie over tentamendata bekend)
Niveau:Bachelor
Studielast:6 ECTS credits

Docent(en)


prof. dr. A.P.J. van den Bosch

prof. dr. E.J. Krahmer


Doel van de cursus

Deze cursus heeft als doel om
  1. studenten inzicht te verschaffen in de mogelijkheden, de stand van zaken, en de problemen van taaltechnologie,
  2. een overzicht te geven van de belangrijkste toepassingsgebieden.


Inhoud van de cursus

Taaltechnologie (ook wel language engineering of natural language processing genoemd) is het computationeel verwerken van taal in gesproken of geschreven vorm. Taaltechnologie levert software op, en het gebied heeft daarmee vanzelf bindingen met aan de ene kant de informatica (het leent technieken uit de software engineering en kunstmatige intelligentie), en aan de andere kant de markt (die voor een deel bepaalt wat voor toepassingen onderzocht worden). Het is gebaseerd op (computer-)taalkundige inzichten, maar invloeden uit de informatica en de markt zorgen er niet zelden voor dat taaltechnologie niet gebaseerd is op "diepe" taalkundige kennis, maar op "oppervlakkige" taakgerichte "shortcuts".

De belangstelling voor taaltechnologie is de afgelopen sterk jaren toegenomen. Hier zijn twee redenen voor aan te voeren. Ten eerste is de verwachting dat taaltechnologie (al dan niet in combinatie met spraaktechnologie) de interactie tussen mensen en machines eenvoudiger kan maken.
Een tweede belangrijke reden is de explosieve groei van informatie. Eenvoudige information retrieval technieken volstaan steeds minder, en de behoefte aan intelligente vormen van information retrieval en information extraction ("smart browsing") is sterk groeiende.
In dit college zullen studenten vertrouwd gemaakt worden met:

  1. de basiselementen van de taaltechnologie (part of speech tagging, lexicalized parsing, PCFGs, machine learning voor natuurlijk taal);
  2. enkele belangrijke toepassingen (information extraction, spoken dialogue systems, text mining, text summarization, question answering).


Verplichte literatuur

  1. Jackson, P. & I. Mouliner, Natural Language Processing for Online Applications: Text Retrieval, Extraction & Categorization, John Benjamins, 2002.

(18-jul-2017)