Cito

Zijn examenresultaten van jaar tot jaar vergelijkbaar?

22 mei 2002

Je hoort regelmatig de opmerking: Het examen van dit jaar in vak x was veel moeilijker of gemakkelijker dan dat van vorig jaar. Maar betekent dat ook dat kandidaten benadeeld worden? Op grond van de principes van eerlijkheid en transparantie van toetsing mogen kandidaten verwachten dat het examen waarvoor ze opgaan gelijkwaardig is aan de oudere examens. En dat streven examenmakers dan ook na. Maar wat betekent gelijkwaardigheid en hoe wordt die bereikt?

Allereerst maakt de Citogroep in opdracht van de Centrale examencommissie vaststelling opgaven (Cevo) examens die qua inhoud zo gelijkwaardig mogelijk zijn. De examenprogramma's liggen vast en de leerstof die in de examens aan de orde wordt gesteld ook. Tevens staat vast welke vaardigheden nodig zijn voor het beantwoorden van de vragen. Door examens samen te stellen aan de hand van een examenmodel, in vakjargon toetsmatrijs, is ook de spreiding over de leerstof van jaar tot jaar vergelijkbaar. Ten slotte worden examenvragen gemaakt door docenten die ruime ervaring hebben in examenklassen en nog eens beoordeeld door vakdeskundigen.

Maar dan nog is niet gegarandeerd dat de examens van jaar tot jaar even moeilijk zijn. Het blijkt helaas op voorhand erg moeilijk om precies in te schatten hoe moeilijk een bepaalde vraag is. Dus, hoewel examens inhoudelijk gelijkwaardig zijn, kunnen ze toch nog verschillen in moeilijkheid.
Dit verschil in moeilijkheidsgraad hoeft geen probleem te zijn als daarmee bij de normering van het examen rekening wordt gehouden.

Normering
Een eenvoudige manier is de normering zo aanpassen dat elk jaar de gemiddelde score op het examen gelijk is. Een vergelijkbare methode is de normering zo aan te passen dat het percentage leerlingen dat een onvoldoende haalt op het examen elk jaar even groot is. In de praktijk wordt deze laatste methode bij een deel van de examens gebruikt, bijvoorbeeld wanneer een examen weinig kandidaten heeft of wanneer het onderwerp of het programma van het examen vaak wisselt. Ook spelen kostenoverwegingen een rol. Deze methoden zijn eenvoudig uit te voeren, maar ze hebben ook een belangrijk nadeel. Ze gaan eraan voorbij dat de vaardigheid van de leerlingen van jaar tot jaar zou kunnen verschillen. Groepen leerlingen kunnen vaardiger of minder vaardig zijn. Voor een individuele leerling zou de waardering van zijn of haar prestatie mede afhangen van de prestaties van de andere examenkandidaten. Als de andere leerlingen beter presteren krijgt hij of zij een lager cijfer dan wanneer de andere leerlingen minder gepresteerd zouden hebben. Het gevolg is dat het voor leerlingen uit kan maken in welk jaar zij examen doen.

Zelfde prestatie, zelfde cijfer
Het doel van de normering van examens is echter om voor een zelfde prestatie elk jaar een zelfde cijfer te geven. Hiervoor is het nodig een onderscheid te maken tussen de moeilijkheid van de examens en de vaardigheid van de examenkandidaten. Op basis van vergelijking van de verzamelde afnamegegevens van twee examens, het ene van dit jaar en het andere van vorig jaar, kan dit onderscheid echter niet gemaakt worden. Want als het behaalde aantal scorepunten op het nieuwe examen overwegend lager is dan het behaalde aantal scorepunten op het examen van vorig jaar dan is niet bekend of dat aan de opgaven lag of aan een verschil in vaardigheid van de kandidaten, of aan beide.

Aanvullend onderzoek
Om dit onderscheid toch te kunnen maken moet er aanvullende informatie verzameld worden. Het eenvoudigst zou zijn om beide examens bij dezelfde groep leerlingen af te nemen. In dat geval zijn immers verschillen in resultaten op beide examens alleen het gevolg van een verschil in moeilijkheid van de examens. Het is echter praktisch niet haalbaar om twee examens onder examencondities af te nemen bij dezelfde groep leerlingen. Belangrijke complicaties hierbij zijn dat de vragen van oude examens openbaar en daarmee bekend zijn, dat het niet mogelijk is vragen op te nemen in een examen die niet meetellen voor het eindcijfer en dat het nieuwe examen in verband met geheimhouding niet afgenomen kan worden voor de eigenlijke examendatum. Verder is het praktisch onmogelijk om bij dezelfde groep leerlingen een toets ter grootte van twee volledige examens af te nemen. Dat zou vier tot zes uur kosten. En als dat al zou lukken, dan moeten ook nog eens de afnamecondities vergelijkbaar zijn aan de examenconditie. Waarbij het moeilijkste punt is dat de leerling evenveel belang moet hebben bij een goed resultaat als bij een echt examen het geval zou zijn.

Model
Gelukkig is het niet noodzakelijk om de beide volledige examens af te nemen bij dezelfde groep leerlingen. Met beperkte aanvullende gegevens van groepen leerlingen die een aantal van de vragen uit het ene examen en een aantal van de vragen uit het andere examen maken, kunnen we de prestatie op beide examens van een gelijkwaardige groep leerlingen met behulp van een statistisch model schatten.
In de praktijk worden de aanvullende gegevens verzameld bij groepen leerlingen die geacht mogen worden de opgaven op een redelijk niveau te kunnen maken. Er bestaan bij examens twee verschillende opzetten voor de verzameling van de aanvullende gegevens. In beide opzetten worden vragen waarvan bekend is hoe moeilijk ze zijn gecombineerd met nieuwe vragen. In het ene geval worden deze vragen afgenomen voordat het nieuwe examen is samengesteld. Bij de samenstelling van het examen wordt er dan voor gezorgd dat het examen een gelijke moeilijkheidsgraad heeft met voorgaande examens. In het tweede geval worden de aanvullende gegevens verzameld direct na afloop van het examen zodat de leerlingen nog niet bekend kunnen zijn met de opgaven uit het nieuwe examen. Op basis van een statistisch model wordt daarna bekeken hoe het examen genormeerd moet worden om een gelijke prestatie-eis te stellen als op eerdere examens. En daarmee worden leerlingen niet bevoordeeld of benadeeld ten opzichte van leerlingen in een ander examenjaar.

Rol Cevo
De Centrale examencommissie vaststelling opgaven (Cevo) stelt namens de minister de examenopgaven vast en is ook verantwoordelijk voor de normering. De Citogroep adviseert de Cevo over de normering van de examens. De adviesnormen van de Citogroep zijn gebaseerd op de procedures zoals hier beschreven. Deze adviesnormen zijn voor de Cevo een belangrijk gegeven. De Cevo kan echter afwijken van de adviesnorm, bijvoorbeeld omdat het examenprogramma of de studielast gewijzigd is.

Voor geĂŻnteresseerden is een uitgebreide beschrijving van de gebruikte statistische modellen te vinden op
http://www.toetswijzer.nl/html/normering/normering.pdf