Radboud Universiteit Nijmegen
Europese taalexperts willen digitale ontsluiting onderzoeksgegevens
80 taalexperts uit 22 Europese landen bespreken in Nijmegen hoe ze de
enorme hoeveelheid aan taalonderzoeksgegevens beter en makkelijker
digitaal toegankelijk kunnen maken. Centraal op de conferentie staat
CLARIN, een pan-Europees project over onderzoeksinfrastructuur op het
gebied van taal en taaltechnologie.
Wetenschappers over de hele wereld doen onderzoek naar talen en
taalprocessen. De hoeveelheid taaldata op internet is inmiddels enorm.
Het gaat om zeer uiteenlopende gegevens: van gedigitaliseerde
middeleeuwse tekstbestanden tot video-opnames van leesonderzoek, van
commentaren bij teksten tot spraakherkenningssoftware.
De tools en software om die data te bekijken of te analyseren, zijn
echter vooralsnog vooral toegankelijk voor experts. Zonder hun hulp
kunnen individuele onderzoekers daarmee vaak niet uit de voeten.
Onderlinge uitwisseling van onderzoeksgegevens is tot nu toe nog erg
ingewikkeld. Er is dan ook dringend behoefte aan een elektronische,
internationale infrastructuur die voor iedereen toegankelijk is.
Gemak, snelheid en gebruiksvriendelijkheid'
'Je kunt het vergelijken met de TGV, de hogesnelheidstrein', zegt
Peter Wittenburg, hoofd Technical Group bij het Max Planck Institute
for Psycholinguistics in Nijmegen, een van de stuwende krachten achter
CLARIN en medeorganisator van de conferentie. 'Iedereen gebruikt de
TGV om snel van A naar B te komen, maar dat lukt alleen bij de gratie
van goede rails en een goede infrastructuur. Binnen de taaltechnologie
en de linguïstiek ontbreekt het nog aan zo'n onderzoeksinfrastructuur.
Daardoor raken steeds meer taalonderzoekers afgesloten van de enorme
hoeveelheid interessante onderzoeksdata op internet en van het gebruik
van de tools. Met CLARIN willen we bereiken dat iedereen straks zelf
vanachter zijn eigen notebook of pc taaldata kan bekijken of
analyseren. Het gaat om gemak, snelheid en gebruiksvriendelijkheid.'
Meer dan honderd Europese onderzoeksinstituten
Bij CLARIN zijn meer dan honderd onderzoeksinstituten in Europa
betrokken op het gebied van taaltechnologie en linguïstiek. 'Deze
Pan-Europese aanpak is nieuw', weet Wittenburg. 'We zijn hiermee zelfs
de Amerikanen ver vooruit.'
Het CLARIN-consortium werkt bij voorkeur samen met de grote instituten
die nationale ondersteuning krijgen. 'Elk land is bezig met nationale
projecten op het gebied van infrastructuur, maar we moeten die naar
een Europees niveau tillen om een kritische massa te bereiken in een
globale wereld. Wij hebben ook al contact met Microsoft en Google om
met ons samen te werken. Als wij onze research-infrastructuur niet
zelf vanuit de researchwereld aanpakken, worden we straks opgegeten
door Google. Op z'n zachtst gezegd gevaarlijk.'
De Nijmeegse wethouder van onderwijs, J. Kunst, opent de conferentie
op 17 maart in de gemeentelijke raadszaal. De dagen daarna verplaatst
het Pan-Europese gezelschap zich naar het Max Planck Institute for
Psycholinguistics bij de Radboud Universiteit.