Universiteit van Tilburg
Computer leert taal zonder grammatica

Inaugurele rede hoogleraar Geheugen, taal en betekenis

Echt praten met computers en robots kan nog steeds alleen maar in science fiction. De structuur en de inhoud van taal is bijzonder moeilijk in regels te vangen die de computer 'begrijpt'. Maar de computer kan wel taal leren op grond van een eenvoudig redeneermechanisme, betoogt hoogleraar Antal van den Bosch vrijdag 10 oktober in zijn inaugurele rede. Het enige wat de computer nodig heeft, zijn veel voorbeelden en een goed geheugen.

Taalkundigen en technologen proberen de computer op allerlei manieren te laten communiceren. Het zou zo handig zijn om teksten automatisch te kunnen laten vertalen naar willekeurig welke andere taal, of de telefoon op zinvolle wijze door een computer te laten beantwoorden. Maar het uitvoeren van deze taken via programmeertaal, de enige taal die de computer echt begrijpt, blijkt een bijzonder moeilijke onderneming te zijn.

Traditionele methoden berusten vaak op een automatische analyse van zowel de grammatica als de betekenis van woorden en zinnen. Maar het kan veel eenvoudiger en beter, stelt hoogleraar Geheugen, taal en betekenis Antal van den Bosch. Communicatieve taken die we een computer graag willen laten uitvoeren, zijn vrijwel altijd omzettingen van het ene stuk tekst of spraak in het andere; denk aan vertalen, samenvatten, vragen beantwoorden en een dialoog voeren. In plaats van een omweg te maken via een analyse van de grammatica en de betekenis, zou de omzetting ook direct kunnen.

Van den Bosch hanteert een methode waarvoor de computer is geboren: analoog redeneren. Op basis van tienduizenden Nederlandse zinnen en hun Engelse vertaling, kan de computer met behulp van analoog redeneren (ofwel voorbeelden volgen) een nieuwe Nederlandse zin vertalen, ook al heeft hij die nog nooit gezien. Deze methode behaalt betere resultaten dan alle traditionele methoden tot dusver. De computer heeft er slechts een goed geheugen voor nodig en zo veel mogelijk voorbeelden. In zijn inaugurele rede licht Van den Bosch deze methode toe aan de hand van een elementaire taaltaak: voorspellen wat het volgende woord is.

Antal van den Bosch (1969, Made) studeerde Taal- en literatuurwetenschap aan de Universiteit van Tilburg, met als specialisatie taal en informatica. Hij promoveerde aan de Universiteit Maastricht op . Learning to pronounce written words. A study in inductive language learning (cum laude). Hij werkte als onderzoeksassistent aan de Universiteit van Tilburg en de Vrije Universiteit in Brussel en als postdoc onderzoeker, Academieonderzoeker van de KNAW en universitair docent en hoofddocent aan de UvT. Sinds twee jaar is hij als gasthoogleraar verbonden aan de Universiteit van Antwerpen. Met ingang van 1 januari 2008 is hij in Tilburg benoemd tot hoogleraar Geheugen, taal en betekenis.



Universiteit van Tilburg