Nieuwe methode meet automatisch kwaliteit van Wikipedia-pagina's

Nieuwe methode meet automatisch kwaliteit van Wikipedia-pagina's

8 april 2015

Wikipedia is erg handig als naslagwerk, maar hoe weet je of de inhoud klopt? UvA-onderzoeker Xinyi Li ontwikkelde een methode om automatisch de kwaliteit van Wikipedia-pagina's te beoordelen. Hij presenteerde zijn model onlangs tijdens de `European Conference on Information Retrieval' in Wenen.

Wikipedia is de grootste en meest geraadpleegde online encyclopedie. Artikelen kunnen echter door iedereen worden geschreven of aangepast. Hierdoor groeit de online encyclopedie snel. Gevolg is echter wel dat de kwaliteit van artikelen niet systematisch wordt gewaarborgd. Van alle Wikipedia-artikelen wordt slechts een klein aandeel handmatig op kwaliteit beoordeeld. Om de waarde van alle andere pagina's in te schatten, zijn automatische evaluatiemethodes nodig.

Wie schreef welk artikel?

Huidige methodes voor het automatisch beoordelen van kwaliteit zijn gebaseerd op de inhoud van het artikel. Li maakt met zijn methode, naast de inhoud, gebruik van de informatie wie heeft bijgedragen aan een artikel. De meeste artikelen worden namelijk door meerdere mensen geschreven, maar niet iedereen draagt evenveel bij. Ook blijkt dat het merendeel van de auteurs slechts over een beperkt aantal onderwerpen schrijft.

Door naast de inhoud ook de deskundigheid en het aantal bijdragen van auteurs in acht te nemen, is de methode van Li beter in staat de kwaliteit van een artikel in te schatten dan methodes die alleen naar inhoud kijken.

Li's software zou - in theorie - ingezet kunnen worden om geautomatiseerd waarschuwingen te tonen voor `lage kwaliteit.' Nu is het zo dat er een waarschuwing wordt geplaatst bij artikelen op Wikipedia waarbij referenties ontbreken, er weinig tekst is, of de schrijfstijl niet objectief is.

Publicatiegegevens

Li X, Tang J, Wang T, Luo Z, de Rijke M. 2015. `Automatically assessing Wikipedia article quality by exploiting article-editor networks.' ECIR 2015: 37th European Conference on Information Retrieval.

Gepubliceerd door UvA Persvoorlichting