Eén-klasse-classificatie
19 juni 2001 | 10.30 uur | Aula TU Delft
Promotie van hr. D.M.J. Tax | doctorandus in de natuurkunde Promotor | prof.dr. I.T. Young (fac. TNW)
Toeg.prom. | dr.dr.ir R.P.W. Duin (UHD-fac. TNW)

One-class classification. Concept-learning in the absence of counter-examples
In één-klasse classificatie (one-class classification) probeert men objecten van één klasse te onderscheiden van alle mogelijke andere objecten. De taak is om een classificator te trainen aan de hand van een set van voorbeelden. Er wordt aangenomen dat alleen voorbeelden van één van de klassen, de doel klasse of target class, aanwezig is. Dit één-klasse probleem treedt bijvoorbeeld op bij: 1) novelty detectie (voor machine conditie monitoring waar fouten gedetecteerd moeten worden); 2) uitbijter detectie (voor een betrouwbaarder classificatie van nieuwe data); 3) classificatie van data met onevenwichtig gesampelde klassen (classificatie in medische data waar bepaalde ziektes erg zeldzaam zijn). Het feit dat er geen voorbeelden van objecten die niet tot de doel-klasse behoren (uitbijters of outliers) beschikbaar zijn, compliceert de training van een één-klasse classificator. Het is niet voldoende dat het aantal fouten dat de classificator maakt om de doel-klasse minimaal is, maar het is ook vereist dat de kans op een fout op uitbijter data geminimaliseerd wordt. Een manier om de kans op een fout op de uitbijters te minimaliseren, is om het volume dat de één-klasse classificator inneemt in de kenmerkruimte, te minimaliseren. In zijn proefschrift stelt Tax een nieuwe methode voor, die sommige problemen in de standaard aanpak voor één-klasse classificatie omzeilt. De methode fit een hyperbool rondom de data met minimaal volume. Het blijkt dat de hyperbool gekarakteriseerd kan worden met behulp van enkele data objecten, de support vectoren. Deze methode wordt daarom de Support Vector Data Description genoemd. Bovendien is het mogelijk om de data naar een nieuwe kenmerkruimte af te beelden waar weer een data beschrijving getraind kan worden, maar zonder de extra computationele kosten. Wanneer de data wordt afgebeeld naar een geschikte representatie, kan de methode een flexibelere en krappere beschrijving leveren.

Afkortingen

BK Faculteit Bouwkunde
CiTG Faculteit Civiele Techniek en Geowetenschappen ITS Faculteit Informatietechnologie en Systemen
TNW Faculteit Technische Natuurwetenschappen
LR Faculteit Luchtvaart- en Ruimtevaarttechniek OCP Faculteit Ontwerp, Constructie en Productie
TBM Faculteit Techniek, Bestuur en Management

Aantekeningen