Centrum voor Wiskunde en Informatica
Persbericht Centrum Wiskunde & Informatica
Amsterdam, 15 april 2010

Onderzoek maakt informatie uit verschillende databronnen toegankelijk voor gebruiker

Culturele organisaties publiceren onafhankelijk van elkaar informatie over hun collecties op internet. Musea stellen bijvoorbeeld informatie beschikbaar over impressionistische schilderijen, terwijl andere organisaties dat doen over impressionistische schilders. Met huidige zoekmethoden is deze informatie alleen in geïsoleerde vorm beschikbaar en ontbreekt elke samenhang. Dit vergt veel handmatig zoekwerk. In zijn proefschrift 'End-user support for access to heteregeneous linked data' onderzocht Michiel Hildebrand van het Centrum Wiskunde & informatica (CWI) in Amsterdam, hoe informatie uit verschillende databronnen van ons cultureel erfgoed voor de eindgebruiker toegankelijk kan worden gemaakt.

De ontwikkeling van het Semantische Web maakt het mogelijk om de databronnen van verschillende organisaties met elkaar te laten 'communiceren' en met elkaar te verbinden. Het onderzoek van Hildebrand maakt deel uit van MultiMediaN e-culture, een nationaal e- culture project. Hierin is naast de collecties van een aantal Nederlandse musea, waaronder het Rijksmuseum, ook uitgebreide achtergrondinformatie over het cultureel erfgoed domein met elkaar verbonden. Hildebrand verdedigt 20 april zijn proefschrift aan de Universiteit van Amsterdam. Zijn onderzoek is van toepassing voor experts in het cultureel erfgoed domein, in de muziekindustrie en voor nieuwsagentschappen.

Een grote uitdaging in het gebruik van deze databronnen is de heterogeniteit. Niet alleen gaat het om een grote diversiteit in databronnen, maar ook om de manier waarop ze beschreven zijn. Zo is er over het impressionisme uiteenlopende informatie beschikbaar over schilders, werken, specifieke materialen, technieken, gebeurtenissen en plaatsen. Daarnaast besteden organisaties op verschillende manieren aandacht aan bijvoorbeeld een bekende impressionistische schilder als Monet.

Hildebrand ontwikkelde vanuit het perspectief van de eindgebruiker verschillende soorten zoek-functionaliteit en presentatiemethoden die om kunnen gaan met heterogene informatie. In zijn onderzoek stonden drie vragen centraal: Welke data zijn beschikbaar en in wat voor relatie staan ze tot elkaar? Welke algoritmes beschikken over de flexibiliteit om te zoeken in heterogene bronnen? Welke presentatiemethoden zijn geschikt om eindgebruikers te ondersteunen in het zoekproces? Het is de eerste keer dat onderzoek op dit gebied al deze aspecten omvat en uitgaat van zowel data als algoritmes en interactie met de eindgebruiker.

Het onderzoek van Hildebrand maakt het mogelijk om de ondersteuning in het zoekproces te verbeteren door informatie uit verschillende databronnen te combineren. Hij heeft hierbij gebruik gemaakt van technologieën voor het Semantische Web. Door samen te werken met experts uit het cultureel erfgoed domein wordt het duidelijk hoe deze technologieën gebruikt kunnen worden om gebruikers beter te ondersteunen met hun dagelijkse zoektaken in grote hoeveelheden gelinkte data. De explosieve toename van digitale data stelt de samenleving en wetenschap voor nieuwe vragen. Dit is een belangrijk onderzoekthema op het CWI. Het onderzoek van Hildebrand heeft hier een belangrijke bijdrage aan geleverd.

Over CWI :
Het Centrum Wiskunde & Informatica (CWI) is sinds 1946 het nationale onderzoeksinstituut voor wiskunde en informatica. Het is gevestigd op het Science Park Amsterdam en is deel van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO). Het instituut heeft een sterke
internationale positie. Ruim 160 wetenschappers doen er grensverleggend onderzoek in ongeveer 70 projecten, en dragen de verkregen kennis over aan de maatschappij. Ongeveer 30 van de onderzoekers zijn hoogleraar aan een universiteit. Uit het instituut komen circa twintig spin-off
bedrijven voort.

Noot voor redacties
(