Het Amsterdamse softwarebedrijf Gridline heeft van de Nederlandse Taalunie de opdracht gekregen een programma te ontwikkelen voor de extractie van termen uit vakteksten. De Taalunie betaalt 144.000 euro voor deze oplossing, genaamd TermTreffer. GridLine is gespecialiseerd in taal- en zoekoplossingen voor het Nederlands. Volgens de Taalunie is de applicatie van belang voor de ontsluiting van vakjargon in de maatschappij.
De Nederlandse Taalunie is een beleidsorganisatie waarin Nederland, Vlaanderen en Suriname samenwerken op het gebied van het Nederlands. De Taalunie wil TermTreffer inzetten voor de semi-automatische extractie van zogeheten termkandidaten uit digitale vakteksten. De applicatie zal in staat zijn in Nederlandstalige teksten termen van gewone woorden te onderscheiden en die vervolgens te selecteren uit de tekst, samen met een reeks taalkundige kenmerken zoals geslacht, vervoegingen en verbuigingen.
De ontwikkeling van het computerprogramma neemt ongeveer een jaar in beslag. Gridline, die de aanbesteding won van vier concurrenten, krijgt bij de projectuitvoering ondersteuning van een groep experts op het vlak van taaltechnologie en terminologie, gecoördineerd door Tom Vanallemeersch (Lessius Hogeschool, Antwerpen). De Taalunie zal het softwareprogramma beschikbaar stellen aan alle potentiële gebruikers, waaronder vertaaldiensten, overheidsinstanties, software-ontwikkelaars en wetenschappelijk onderzoekers.
Terminologiebank
Volgens de beleidsorganisatie is TermTreffer van belang voor een goede ontsluiting van vaktermen in maatschappelijk verband. Voor veel niet-vakgenoten is vakterminologie doorgaans abacadabra. Het softwareprogramma stelt vakmensen in staat om hun terminologie te evalueren en waar nodig aan te passen en biedt ook woordenboekmakers de kans om termen in hun woordenboeken op te nemen en deze nauwkeurig voor een algemeen publiek te beschrijven.
Verder wijst de Taalunie erop dat terminologieverzamelingen nodig zijn om vertalers in staat te stellencomplexe vakteksten te vertalen. Ook zijn terminologiebanken van belang voor kennisbeheer en voor het beheren en ontsluiten van grote informatiesystemen, zoals bijvoorbeeld de wet- en regelgeving binnen een bepaald land. Zonder software voor terminologie-extractie moet het verzamelen van termen binnen vakgebieden handmatig gebeuren en dat kost veel tijd en geld.
Het bedrijf http://www.syn-tactic.com biedt dit al meerdere jaren aan …
met het product easyrules kan dit op eenvoudige wijze in elke taal worden uitgevoerd, grote internationale bedrijven gebruiken dit product voor diverse toepassingen met diverse talen.
het uitbesteden van dit soort werkzaamheden alsmede de bijbehorende databases is al meerdere keren gedaan door red rock technology,
uitbesteden naar India kost een fractie,
de kwaliteit is belangrijk hoger dan werk in NL.
extractie-termen kunnen geheel automatisch worden gemaakt
daar bestaat gewoon programmatuur voor in India