Universiteit Leiden

Opvallende patronen verraden gedrag websurfers

Welk gedrag vertonen bezoekers van een website? Kopen ze een specifiek product vooral op maandagen? Of keren ze steeds op een bepaald moment van de dag terug? Voor ondernemers is het lucratief om dergelijke patronen te herkennen en te benutten. Edgar de Graaf onderzocht hoe interessante patronen te vinden. Hij ontdekte dat tijd daarbij een belangrijke factor is. Hij promoveert woensdag 29 oktober op dit onderwerp. Afbeelding: Artistieke impressie van data mining van Thomas Thü Hürlimann Data mining
In vaktermen heet het data mining: het zoeken naar interessante verbanden in grote hoeveelheden gegevens. Veel dataminingprogramma's produceren een stortvloed aan mogelijk interessante patronen. Hoe vind je dan als gebruiker wat je zoekt? De bestanden zijn bovendien vaak niet ingericht op dergelijke zoekacties, zoals het geval is op internet maar ook in de bio-informatica. Meestal gaat het om semigestructureerde bestanden, vaak met hyperlinks naar andere bestanden, en ze bevatten (deel)informatie in allerlei formaten, zoals tekst, beeld en geluid. Tijdsaspect
De Graaf werkte binnen het MISTA-project (Mining in Semi-Structured Data) aan methoden om gerichter en sneller patronen te vinden in grote hoeveelheden semigestructureerde gegevens. Hij ontdekte dat sommige patronen interessant zijn omdat ze vlak achter elkaar voorkomen. Andere patronen vallen juist op doordat ze bijvoorbeeld wekelijks voorkomen. Dit tijdsaspect is volgens De Graaf de moeite waard om nader te onderzoeken. Visueel
De presentatie van de patronen kan het beste visueel worden gedaan, zodat de gebruiker in één oogopslag de informatie vindt die hij zoekt. Hiervoor beschrijft De Graaf verschillende manieren om verschillende soorten informatie weer te geven. Het onderzoek is uitgevoerd binnen de Open competitie 2003 van NWO Exacte Wetenschappen.

(28 oktober 2008/SH)