Radboud Universiteit Nijmegen


Europese taalexperts willen digitale ontsluiting onderzoeksgegevens

80 taalexperts uit 22 Europese landen bespreken in Nijmegen hoe ze de enorme hoeveelheid aan taalonderzoeksgegevens beter en makkelijker digitaal toegankelijk kunnen maken. Centraal op de conferentie staat CLARIN, een pan-Europees project over onderzoeksinfrastructuur op het gebied van taal en taaltechnologie.

Wetenschappers over de hele wereld doen onderzoek naar talen en taalprocessen. De hoeveelheid taaldata op internet is inmiddels enorm. Het gaat om zeer uiteenlopende gegevens: van gedigitaliseerde middeleeuwse tekstbestanden tot video-opnames van leesonderzoek, van commentaren bij teksten tot spraakherkenningssoftware.

De tools en software om die data te bekijken of te analyseren, zijn echter vooralsnog vooral toegankelijk voor experts. Zonder hun hulp kunnen individuele onderzoekers daarmee vaak niet uit de voeten. Onderlinge uitwisseling van onderzoeksgegevens is tot nu toe nog erg ingewikkeld. Er is dan ook dringend behoefte aan een elektronische, internationale infrastructuur die voor iedereen toegankelijk is.

Gemak, snelheid en gebruiksvriendelijkheid'
'Je kunt het vergelijken met de TGV, de hogesnelheidstrein', zegt Peter Wittenburg, hoofd Technical Group bij het Max Planck Institute for Psycholinguistics in Nijmegen, een van de stuwende krachten achter CLARIN en medeorganisator van de conferentie. 'Iedereen gebruikt de TGV om snel van A naar B te komen, maar dat lukt alleen bij de gratie van goede rails en een goede infrastructuur. Binnen de taaltechnologie en de linguïstiek ontbreekt het nog aan zo'n onderzoeksinfrastructuur. Daardoor raken steeds meer taalonderzoekers afgesloten van de enorme hoeveelheid interessante onderzoeksdata op internet en van het gebruik van de tools. Met CLARIN willen we bereiken dat iedereen straks zelf vanachter zijn eigen notebook of pc taaldata kan bekijken of analyseren. Het gaat om gemak, snelheid en gebruiksvriendelijkheid.'

Meer dan honderd Europese onderzoeksinstituten
Bij CLARIN zijn meer dan honderd onderzoeksinstituten in Europa betrokken op het gebied van taaltechnologie en linguïstiek. 'Deze Pan-Europese aanpak is nieuw', weet Wittenburg. 'We zijn hiermee zelfs de Amerikanen ver vooruit.'
Het CLARIN-consortium werkt bij voorkeur samen met de grote instituten die nationale ondersteuning krijgen. 'Elk land is bezig met nationale projecten op het gebied van infrastructuur, maar we moeten die naar een Europees niveau tillen om een kritische massa te bereiken in een globale wereld. Wij hebben ook al contact met Microsoft en Google om met ons samen te werken. Als wij onze research-infrastructuur niet zelf vanuit de researchwereld aanpakken, worden we straks opgegeten door Google. Op z'n zachtst gezegd gevaarlijk.'

De Nijmeegse wethouder van onderwijs, J. Kunst, opent de conferentie op 17 maart in de gemeentelijke raadszaal. De dagen daarna verplaatst het Pan-Europese gezelschap zich naar het Max Planck Institute for Psycholinguistics bij de Radboud Universiteit.