Validiteit is het meest centrale kwaliteitscriterium in de psychodiagnostiek. Waar betrouwbaarheid gaat over de consistentie van een meting, gaat het bij het begrip validiteit om de vraag of een test daadwerkelijk meet wat hij beoogt te meten. Een instrument kan zeer consistent meten, maar als het niet het juiste construct in kaart brengt, zijn de diagnostische conclusies ongeldig. Voor psychologen, verwijzers en opdrachtgevers is dit concept bepalend voor de waarde van testresultaten.
Drie vormen van testgeldigheid
De psychometrie onderscheidt drie hoofdvormen. Constructgeldigheid betreft de vraag of een test het beoogde psychologische concept meet. Bij een intelligentietest zoals de WAIS-IV is uitgebreid onderzocht of de test daadwerkelijk cognitieve capaciteiten in kaart brengt. Dit bewijs komt uit factoranalyses, correlaties met andere intelligentietests en onderzoek naar de interne structuur van het instrument.
Criteriumgeldigheid gaat over de voorspellende waarde. Voorspellen de testscores een relevant extern criterium? Een arbeidsgeschiktheidstest is criteriumgeldig als hogere scores samenhangen met beter werkfunctioneren. Inhoudsgeldigheid tot slot betreft de vraag of de testitems het volledige domein van het construct dekken. Een depressievragenlijst die alleen slaapproblemen uitvraagt, heeft onvoldoende inhoudsdekking.
Moderne psychometrische richtlijnen, zoals de Standards for Educational and Psychological Testing van de APA, beschouwen deze vormen als samenhangende aspecten van één overkoepelend concept. Het gaat uiteindelijk om de vraag: zijn de conclusies die op basis van de testscores worden getrokken, gerechtvaardigd?
Waarom is dit bepalend voor diagnostische conclusies?
Een test kan uitstekend consistent meten en toch ongeschikt zijn voor de vraagstelling. Wanneer een psycholoog een persoonlijkheidsvragenlijst inzet om cognitieve capaciteiten te beoordelen, is de test niet geldig voor dat doel, ongeacht de technische meetkwaliteit. De COTAN beoordeelt de geldigheid van tests als een van de zeven kwaliteitscriteria en geeft daarmee richting aan de instrumentselectie.
De AST-NIP 2024 schrijft voor dat de psycholoog in de rapportage verantwoordt waarom een bepaald instrument is gekozen en hoe het aansluit bij de vraagstelling. In de arbeidssector speelt ook de ecologische geldigheid een rol: in hoeverre voorspellen de testresultaten het functioneren in het dagelijks leven en op de werkplek? Een rapport dat gebaseerd is op instrumenten die niet geldig zijn voor de specifieke vraag, houdt geen stand bij een bezwaarprocedure of second opinion.
Relatie met betrouwbaarheid
Meetconsistentie is een noodzakelijke voorwaarde voor geldigheid. Een test die bij herhaalde afname sterk wisselende resultaten oplevert, kan onmogelijk een stabiel construct meten. Het omgekeerde geldt niet: een test kan zeer consistent meten maar toch het verkeerde construct in kaart brengen. Beide eigenschappen moeten in orde zijn voor verantwoord diagnostisch gebruik. De COTAN beoordeelt ze dan ook als afzonderlijke criteria.
Testgeldigheid bij PSYVICE
PSYVICE selecteert instrumenten op basis van de specifieke vraagstelling en controleert of het instrument geldig is voor het beoogde doel. Alleen tests met een positieve COTAN-beoordeling worden ingezet. Alle onderzoeken worden uitgevoerd in samenwerking met en ondertekend door een BIG-geregistreerde professional. Neem contact op voor meer informatie of bekijk de onderzoekspakketten.
Toepassingen
Validiteit is het centrale kwaliteitscriterium bij de selectie en interpretatie van psychologische tests. Het speelt een rol bij:
- De keuze van instrumenten die passen bij de diagnostische vraagstelling
- De onderbouwing van diagnostische conclusies
- De beoordeling van testinstrumenten door de COTAN
- De interpretatie van testresultaten in de rapportage
- De wetenschappelijke verantwoording van diagnostische methoden
Geschikt voor
Psychologen die instrumenten selecteren voor diagnostisch onderzoek. Relevant voor verwijzers en opdrachtgevers die rapportages beoordelen en willen begrijpen of de juiste tests zijn ingezet. Informatief voor cliënten die willen weten waarom bepaalde instrumenten zijn gekozen.
Niet geschikt bij
Het concept is een eigenschap van de interpretatie van testscores, niet van de test op zichzelf. Een test kan valide zijn voor het ene doel maar niet voor het andere. Validiteit moet altijd worden beoordeeld in relatie tot de specifieke vraagstelling en de doelpopulatie.
Praktijkvoorbeeld
Een psycholoog wil de intellectuele capaciteiten van een 50-jarige cliënt in kaart brengen. De WAIS-IV is hiervoor een valide instrument: het meet aantoonbaar de cognitieve domeinen die het beoogt te meten (constructvaliditeit) en de scores voorspellen functioneren in werk en opleiding (criteriumvaliditeit). Een persoonlijkheidsvragenlijst zou voor deze vraagstelling niet valide zijn, omdat deze een ander construct meet.
Veelgestelde vragen
Vragen? Hier vind je de antwoorden!
Het begrip verwijst naar de vraag of een test daadwerkelijk meet wat hij beoogt te meten. Een intelligentietest moet intelligentie meten, niet motivatie of culturele kennis. De geldigheid wordt beoordeeld aan de hand van wetenschappelijk bewijs over de relatie tussen testscores en het beoogde construct.
De drie hoofdvormen zijn: constructgeldigheid (meet de test het beoogde psychologische concept?), criteriumgeldigheid (voorspellen de scores een relevant extern criterium, zoals werkprestatie?) en inhoudsgeldigheid (dekken de testitems het volledige domein van het construct?). Moderne psychometrie ziet deze vormen als samenhangende aspecten van één overkoepelend concept.
Betrouwbaarheid gaat over de consistentie van de meting: levert de test steeds vergelijkbare resultaten? Geldigheid gaat over de juistheid: meet de test wat hij moet meten? Een test kan consistent meten maar toch het verkeerde construct in kaart brengen. Beide eigenschappen zijn noodzakelijk voor verantwoord testgebruik.
De COTAN beoordeelt het bewijs voor de geldigheid als een van de zeven kwaliteitscriteria. Hierbij wordt gekeken naar constructonderzoek, criteriumonderzoek en de mate waarin de testhandleiding onderbouwt dat de test geschikt is voor het beoogde gebruik.
PSYVICE selecteert instrumenten op basis van de vraagstelling en controleert of het instrument geldig is voor het specifieke doel. Alleen tests met een positieve COTAN-beoordeling worden ingezet. Elk onderzoek wordt uitgevoerd in samenwerking met en ondertekend door een BIG-geregistreerde professional.
Bronnen & referenties
Evers, A., Lucassen, W., Meijer, R., & Sijtsma, K. (2010). COTAN Beoordelingssysteem voor de kwaliteit van tests. Nederlands Instituut van Psychologen.
Commissie Testaangelegenheden Nederland (COTAN). COTAN-documentatie.
American Educational Research Association (AERA), APA, & NCME. (2014). Standards for Educational and Psychological Testing. Washington, DC: AERA.