Nederlandse Taalunie

Taalunie en GridLine werken samen rond terminologie

Nog voor de zomermaanden beginnen de Nederlandse Taalunie en het bedrijf GridLine BV uit Amsterdam aan het terminologieproject TermTreffer. Dat project is gericht op het ontwikkelen van een softwareprogramma voor de extractie van termkandidaten uit digitale vakteksten in het Nederlands. De applicatie zal in staat zijn in Nederlandstalige vakteksten termen van gewone woorden te onderscheiden en die vervolgens te selecteren uit de tekst, samen met een reeks taalkundige kenmerken zoals geslacht, vervoegingen en verbuigingen.

Het project is van groot belang voor de volwaardige deelname van onze taal in het zakelijk, wetenschappelijk, technisch en juridisch communicatieverkeer. Hierin duiken vele vaktermen op die voor vakspecialisten een heldere betekenis hebben, maar die voor niet-vakgenoten en voor gewone mensen onduidelijk of zelfs onbegrijpelijk zijn. Daarom is het van belang deze termen te verzamelen en in ruimer maatschappelijk verband te ontsluiten.

Het softwareprogramma zal vakmensen in staat stellen om hun terminologie te evalueren, te beheren en waar nodig aan te passen en biedt ook woordenboekmakers de kans om termen in hun woordenboeken op te nemen en deze nauwkeurig voor een algemeen publiek te beschrijven. Terminologieverzamelingen zijn ook nodig om vertalers in staat te stellen om complexe vakteksten te vertalen van de ene in de andere taal en daarbij ook de juiste vertaalequivalenten te kiezen. Ten slotte zijn terminologiebanken van belang voor kennisbeheer en voor het beheren en ontsluiten van grote informatiesystemen, zoals bijvoorbeeld de wet- en regelgeving binnen een bepaald land.

Zonder software voor terminologie-extractie moet het verzamelen van termen binnen vakgebieden handmatig gebeuren en dat kost veel tijd en geld. Bovendien worden zoveel vakteksten geproduceerd en verandert de terminologie binnen vakgebieden zo snel dat een handmatige selectie eenvoudigweg geen optie meer is. De selectie moet noodgedwongen worden geautomatiseerd. Het zijn computers die een basisselectie maken, zodat de mens zich kan beperken tot het corrigeren en bewerken van die ruwe selectie.

De Nederlandse Taalunie heeft het project aan GridLine gegund op basis van een aanbesteding naar Europees recht. De ontwikkeling van het computerprogramma zal ongeveer een jaar in beslag nemen en ca. EUR 150.000 gaan kosten. De projectuitvoering wordt wetenschappelijk ondersteund en geëvalueerd door een groep experts op het vlak van taaltechnologie en terminologie en gecoördineerd door Tom Vanallemeersch (Lessius Hogeschool, Antwerpen).

De Taalunie zal het softwareprogramma via de TST-Centrale bij het INL beschikbaar stellen aan alle potentiële gebruikers, o.a. vertaaldiensten, e-overheid, software-ontwikkelaars en wetenschappelijk onderzoekers.

Met de ontwikkeling van dit computerprogramma brengt de Nederlandse Taalunie opnieuw een essentieel hulpmiddel tot stand dat noodzakelijk is om het Nederlands volwaardig te integreren in de moderne informatie- en communicatietechnologie (ICT). De Taalunie heeft het afgelopen decennium in haar beleidsplannen veel aandacht besteed aan de taaltechnologie, om ervoor te zorgen dat onze taal qua bruikbaarheid in moderne toepassingen gelijke tred kan houden met de grote, ons omringende talen.

---

De Nederlandse Taalunie is een beleidsorganisatie waarin Nederland, Vlaanderen en Suriname samenwerken op het gebied van de Nederlandse taal en letteren en het onderwijs in en van het Nederlands. De Taalunie ziet het als haar opdracht om ervoor te zorgen dat alle Nederlandssprekenden hun taal op een doeltreffende manier kunnen gebruiken. Meer informatie over de Taalunie is te vinden op www.taalunieversum.org.

Voor meer informatie kunt u contact opnemen met Johan Van Hoorde, info@taalunie.org, telefoon + 31 70 346 95 48.