Ingezonden persbericht


(Collexis is genomineerd voor de Broos van Erp Prijs 2002, de aanmoedigingsprijs voor succesvolle, startende ondernemers uit het midden- en kleinbedrijf. De prijs is ingesteld op initiatief van de Tweede Kamer door het ministerie van Economische Zaken.)

Collexis introduceert nieuwe versie Collexis
® Engine

Sneller de juiste informatie vinden in grote hoeveelheden ongestructureerde data

Geldermalsen, 20 maart 2002 - Collexis - een organisatie die technologie en applicaties ontwikkelt en implementeert voor het toegankelijk maken van grote hoeveelheden ongestructureerde informatie - heeft een nieuwe versie uitgebracht van de Collexis® Engine. De 3.5 versie heeft een aantal nieuwe eigenschappen, waardoor het mogelijk is nog beter en sneller de juiste informatie te vinden in grote hoeveelheden ongestructureerde informatie.

Collexis® is gebaseerd op het principe van 'fingerprinting'. Hierbij vindt een indexering plaats van tekst door vergelijking met kennis die is vastgelegd in thesauri. Het systeem kan fingerprints creëren van een grote verscheidenheid aan informatie-items; rapporten, artikelen, e-mails, webpagina's et cetera. Deze fingerprints zijn, net als menselijke vingerafdrukken, kleine unieke representaties van hun bron. In de Collexis® Engine 3.5 is het mogelijk metadata bij de fingerprints op te slaan, zoals publicatiedatum en naam van de publicatie of auteur. Hierdoor kunnen gerichte filteringen in de zoekopdracht worden gemaakt.

Als een gebruiker een zoekvraag invoert, wordt deze vraag eveneens samengevat in een fingerprint - net zoals is gebeurd met de informatie-items waarop wordt gezocht. Vervolgens wordt de zoekfingerprint met de fingerprints in de catalogus vergeleken en worden de meest relevante resultaten gevonden. De resultaten hebben een verwijzing naar de originele content, die op basis van gewenste autorisatieregels beschikbaar kan worden gesteld. Informatie kan worden gevonden zonder dat er moet worden gecategoriseerd rondom een bepaald onderwerp of meerdere onderwerpen. Omdat er dikwijls toch vraag is naar het weergeven van documenten in categorieën, biedt Collexis® Engine 3.5 de mogelijkheid om documenten automatisch te plaatsen in een of meerdere relevante categorieën. Dit werkt tevens omgekeerd: documenten kunnen worden weergegeven per geselecteerde categorie.

Wanneer een organisatie Collexis® implementeert, kan zij ervoor kiezen om bestaande databases te fingerprinten of door middel van het dynamisch fingerprinten met een leeg systeem te beginnen. Als de catalogus met fingerprints eenmaal is gevuld, kan deze worden doorzocht door een tekst als zoekvraag te gebruiken; een projectbeschrijving, een webpagina of eerder gebruikte zoekvragen behoren tot de mogelijkheden. Het vergelijkings- en matchingproces is snel en efficiënt: een fingerprint is gemiddeld slechts 400 bytes groot, waardoor een catalogus met 500.000 fingerprints in 20 milliseconden kan worden doorzocht. Naast de uitstekende performance van dit matchingproces zijn in versie 3.5 ook aanpassingen gemaakt aan andere (achtergrond)processen, die hierdoor aanzienlijk in performance zijn verbeterd - soms wel met een factor tien.

Collexis® Engine 3.5 kan dus informatie ontsluiten uit elke soort database; maar ook informatie in bijvoorbeeld webpagina's of e-mails, die normaal niet in een database worden opgeslagen, kan op deze manier in het matchingproces worden meegenomen. Alleen de fingerprints worden opgeslagen op een centrale server. Dit is dan ook de enige hardware-investering die noodzakelijk is. De Collexis® Engine 3.5 draait naast Windows NT en Windows 2000 ook op een XP-platform.


- einde persbericht -

Over Collexis
Collexis ontwikkelt en implementeert unieke technologie en applicaties voor het toegankelijk maken van grote hoeveelheden ongestructureerde informatie. Collexis werd in 1999 als bedrijf opgericht met als doel het systeem, dat oorspronkelijk werd ontwikkeld voor wetenschappelijke toepassingen, geschikt te maken voor een bredere markt. Collexis®-software levert toegevoegde waarde aan organisaties met grote hoeveelheden ongestructureerde data. Tot de klantenkring van Collexis behoren onder andere grote uitgeverijen, zoals Nature Publishing en Elsevier Science, maar ook de Wereldbank en het Nederlandse Ministerie van Economische Zaken. Collexis bezit het intellectuele eigendomsrecht op de software. Een deel van de inkomsten wordt afgestaan aan projecten in ontwikkelingslanden. Het hoofdkantoor van Collexis is gevestigd in Geldermalsen en Collexis wordt vertegenwoordigd in andere Europese landen, de Verenigde Staten, Afrika en Azië.