Nederlandse Organisatie voor Wetenschappelijk Onderzoek

Zoektechniek voor plaatjes herkent visuele patronen

15 februari 2005

NWO-onderzoeker Mirela Tanase ontwikkelde een nieuwe techniek voor het zoeken naar beelden met zoekmachines. Ze baseerde haar techniek op de manier waarop het menselijk oog objecten herkent. Met de nieuwe techniek stijgt het resultaat van de zoekactie van 10 procent naar 70 procent juist gevonden objecten. Tanase promoveert op 16 februari aan de Universiteit Utrecht.

Promovendus Mirela Tanase ontwikkelde twee methoden om objecten op te delen en de vormen te herkennen. De eerste methode deelt het binnengebied van de contour op. Hoewel dit voor de mens eenvoudig is, is het voor een computer niet altijd duidelijk hoe een object moet worden opgedeeld. De tweede methode werkt op allerlei skeletten en deelt de contour zelf op in delen in plaats van de opvulling. Splitsingen in het skelet geven een aanwijzing over welke delen van de contour visueel verschillende delen vormen.

Vervolgens ontwikkelde Tanase een 'part-based'-zoekmachine. Deze zoekmachine vindt plaatjes op basis van delen van objecten. Deze delen van objecten worden door de zoekmachine zelf aangemaakt. Bij de afbeelding van een hert kan de machine bijvoorbeeld zoeken op de poten van het hert. Onder de resultaten zijn dan niet alleen afbeeldingen van een hert, maar ook andere afbeeldingen met dezelfde contouren, bijvoorbeeld elanden, paarden of olifanten.

Deze zoekmethode blijkt een goede aanvulling te zijn voor de methode die door MPEG7 is gekozen om contouren te zoeken. Zo wordt in bepaalde gevallen waar de MPEG7-methode het relatief slecht doet, het aantal juist gevonden objecten verhoogt van 10 procent naar 70 procent.

Digitalisering
In rap tempo zijn de afgelopen jaren veel fotocollecties gedigitaliseerd en via internet voor iedereen beschikbaar gemaakt. Niet alleen musea en art galeries maken hiervan gebruik, ook ziekenhuizen hebben inmiddels databanken met foto's en veel bedrijven hebben een uitgebreid overzicht van al hun producten op het web.

Internetzoekmachines als Google werken goed voor tekstbestanden, maar schieten tekort in een zoekactie naar afbeeldingen. Naarmate het aantal afbeeldingen in collecties toeneemt, worden goede zoekmethoden belangrijker. Het zoeken op sleutelwoorden kost veel tijd en is niet altijd even effectief. Door te kijken naar visuele informatie zoals kleur, textuur en vormen die in de plaatjes zitten, neemt het aantal juist gevonden objecten bij een zoekactie sterk toe.

Het onderzoek van Mirela Tanase wordt gefinancierd door het programma Open Competitie van het NWO-gebied Exacte Wetenschappen.

..................................

Meer informatie bij:

* drs. M. (Mirela) Tanase-Avatavului (UU, Instituut voor Informatica en Informatiekunde)

* t: +31 (0)30 253 14 54, mirela@cs.uu.nl
* promotie 16 februari, promotor prof. dr. M.H. Overmars