Taalunie en GridLine werken samen rond terminologie
Nog voor de zomermaanden beginnen de Nederlandse Taalunie en het
bedrijf GridLine BV uit Amsterdam aan het terminologieproject
TermTreffer. Dat project is gericht op het ontwikkelen van een
softwareprogramma voor de extractie van termkandidaten uit digitale
vakteksten in het Nederlands. De applicatie zal in staat zijn in
Nederlandstalige vakteksten termen van gewone woorden te onderscheiden
en die vervolgens te selecteren uit de tekst, samen met een reeks
taalkundige kenmerken zoals geslacht, vervoegingen en verbuigingen.
Het project is van groot belang voor de volwaardige deelname van onze
taal in het zakelijk, wetenschappelijk, technisch en juridisch
communicatieverkeer. Hierin duiken vele vaktermen op die voor
vakspecialisten een heldere betekenis hebben, maar die voor
niet-vakgenoten en voor gewone mensen onduidelijk of zelfs
onbegrijpelijk zijn. Daarom is het van belang deze termen te verzamelen
en in ruimer maatschappelijk verband te ontsluiten.
Het softwareprogramma zal vakmensen in staat stellen om hun
terminologie te evalueren, te beheren en waar nodig aan te passen en
biedt ook woordenboekmakers de kans om termen in hun woordenboeken op
te nemen en deze nauwkeurig voor een algemeen publiek te beschrijven.
Terminologieverzamelingen zijn ook nodig om vertalers in staat te
stellen om complexe vakteksten te vertalen van de ene in de andere taal
en daarbij ook de juiste vertaalequivalenten te kiezen. Ten slotte zijn
terminologiebanken van belang voor kennisbeheer en voor het beheren en
ontsluiten van grote informatiesystemen, zoals bijvoorbeeld de wet- en
regelgeving binnen een bepaald land.
Zonder software voor terminologie-extractie moet het verzamelen van
termen binnen vakgebieden handmatig gebeuren en dat kost veel tijd en
geld. Bovendien worden zoveel vakteksten geproduceerd en verandert de
terminologie binnen vakgebieden zo snel dat een handmatige selectie
eenvoudigweg geen optie meer is. De selectie moet noodgedwongen worden
geautomatiseerd. Het zijn computers die een basisselectie maken, zodat
de mens zich kan beperken tot het corrigeren en bewerken van die ruwe
selectie.
De Nederlandse Taalunie heeft het project aan GridLine gegund op basis
van een aanbesteding naar Europees recht. De ontwikkeling van het
computerprogramma zal ongeveer een jaar in beslag nemen en ca. EUR
150.000 gaan kosten. De projectuitvoering wordt wetenschappelijk
ondersteund en geëvalueerd door een groep experts op het vlak van
taaltechnologie en terminologie en gecoördineerd door Tom
Vanallemeersch (Lessius Hogeschool, Antwerpen).
De Taalunie zal het softwareprogramma via de TST-Centrale bij het INL
beschikbaar stellen aan alle potentiële gebruikers, o.a.
vertaaldiensten, e-overheid, software-ontwikkelaars en wetenschappelijk
onderzoekers.
Met de ontwikkeling van dit computerprogramma brengt de Nederlandse
Taalunie opnieuw een essentieel hulpmiddel tot stand dat noodzakelijk
is om het Nederlands volwaardig te integreren in de moderne informatie-
en communicatietechnologie (ICT). De Taalunie heeft het afgelopen
decennium in haar beleidsplannen veel aandacht besteed aan de
taaltechnologie, om ervoor te zorgen dat onze taal qua bruikbaarheid in
moderne toepassingen gelijke tred kan houden met de grote, ons
omringende talen.
---
De Nederlandse Taalunie is een beleidsorganisatie waarin Nederland,
Vlaanderen en Suriname samenwerken op het gebied van de Nederlandse
taal en letteren en het onderwijs in en van het Nederlands. De Taalunie
ziet het als haar opdracht om ervoor te zorgen dat alle
Nederlandssprekenden hun taal op een doeltreffende manier kunnen
gebruiken. Meer informatie over de Taalunie is te vinden op
www.taalunieversum.org.
Voor meer informatie kunt u contact opnemen met Johan Van Hoorde,
info@taalunie.org, telefoon + 31 70 346 95 48.
Nederlandse Taalunie