1 Psychometric Assessment
Psychometrische tests domineren al een eeuw lang het intelligentieonderzoek. Het bepalende kenmerk van deze benadering is zijn empirische grondslag; “psychometrisch” verwijst eenvoudig naar de kwantitatieve beoordeling van psychologische toestanden/vermogens. Hoewel kwantitatieve beoordeling berust op een enorme meettechnologie, is de theoretische basis ervan ondiep, zoals blijkt uit de oorsprong ervan. De vroegste tests die de hedendaagse intellectuele maatstaven beïnvloedden, kwamen rechtstreeks voort uit studies van Alfred Binet en collega’s in Frankrijk (Cronbach 1984). In 1904 kreeg Binet de opdracht een manier te bedenken om opvoedbare van niet-opvoedbare studenten te onderscheiden in het relatief nieuwe universele onderwijssysteem. Na onderzoek van schedel-, gezichts-, palmaire- en handschrift indices, ontdekte Binet de directe meting van complexe intellectuele taken met betrekking tot oordeel, begrip en redenering die het meest succesvol was in het onderscheiden van leerlingen. Gebaseerd op dit pragmatische begin definieerde Binet intelligentie als het vermogen om een richting aan te nemen en vol te houden, aanpassingen te maken om een gewenst doel te bereiken, en de prestaties zelfcorrigerend te controleren. Deze definitie, die weinig is uitgewerkt, geeft nog steeds richting aan het psychometrische paradigma.
Typisch is dat moderne psychometrische tests bestaan uit gevarieerde subtests die verschillende aspecten van het losjes gedefinieerde intelligentieconstruct aanboren. Zo kunnen schalen subtests bevatten die een breed spectrum van kennis testen (b.v. de namen van voorwerpen, data, historische en geografische feiten) en de examinandus vragen gekleurde blokken zo samen te stellen dat hun patroon lijkt op een vooraf gespecificeerd ontwerp (Sattler 1992). Nogmaals, de keuze van de subtests wordt niet bepaald door theoretische voorschriften. Subtests worden gekozen omdat ze werken – in combinatie met elkaar dienen ze om personen te rangschikken naar hoeveel ze weten en hoe goed ze zijn in het oplossen van bepaalde problemen. De pragmatische selectie van subtests is gebaseerd op Binet’s opvatting van intelligentie als een algemeen of ongedifferentieerd vermogen (g), zodat de taken die g aftappen in principe onderling verwisselbaar zijn.
De kern van psychometrisch testen ligt in normverwijzing (Sattler 1992). Normreferencing tests worden ontwikkeld door items op een gestandaardiseerde manier toe te dienen aan een representatieve steekproef van de betrokken populatie. De normsteekproef wordt als “representatief” beschouwd in zoverre hij binnen leeftijdsgroepen is gestratificeerd voor variabelen die de prestaties verschillend kunnen beïnvloeden, zoals geslacht, geografische regio, etnische status, grootte van de gemeenschap, enz. Scores worden zodanig geschaald dat de afgeleide score van elk individu een relatieve positie binnen de norm- of standaardiseringsgroep vertegenwoordigt. In die zin is psychometrisch onderzoek een empirische onderneming in de zuiverste zin van het woord: als vergelijkingsconstructie is er weinig behoefte aan theorievorming over de precieze aard van intelligentie.
Zoals gezegd, omvatten de meeste moderne psychometrische tests gevarieerde taken. De oorspronkelijke bedoeling was ervoor te zorgen dat g uitvoerig in kaart werd gebracht. Mettertijd zijn clinici echter de multitaak constructie van intelligentietests gaan uitbuiten om intra-individuele onderscheidingen te maken (Kaufman 1990). Door te kijken naar de variabiliteit tussen subtests of groepen van subtests, veronderstelden beoordelaars over relatieve intellectuele sterktes en zwaktes. Bijvoorbeeld, een bepaalde respondent zou beter kunnen blijken te zijn op geheugentests dan op taken die te maken hebben met conceptualiseren. Het is echter belangrijk op te merken dat de analyse van intra-individuele verschillen zich achteraf ontwikkelde; dergelijke vergelijkingen worden gedreven door de praktische aspecten van welke subtests beschikbaar zijn, eerder dan door een gedetailleerde theorie over de structuur van intelligentie.
De empirische basis van de psychometrische inspanning impliceert zowel zwakte als sterkte. Wat de beperkingen betreft: pogingen om intra-individuele verschillen te interpreteren op basis van een selectie van subtests die pragmatisch zijn gekozen, zijn niet empirisch gevalideerd (Reschly 1997). Bovendien heeft de atheoretische benadering van de taakselectie geleid tot een beperkte en onvolledige bemonstering van het intelligentiedomein (Chen en Gardner 1997). Zo worden bijvoorbeeld muzikale en interpersoonlijke vaardigheden verwaarloosd. In plaats daarvan wordt de nadruk gelegd op vaardigheden die zijn verworven door academisch leren, een gewaardeerd resultaat in de heersende westerse samenlevingen. Daarom maken critici bezwaar tegen het feit dat psychometrische tests weinig meer meten dan de prestaties; zij beoordelen wat een examinandus heeft geleerd, niet het leerpotentieel van de examinandus.
In verband met deze kwestie, en versterkt door de praktijk van het definiëren van individuele intelligentie met verwijzing naar een normgroep, zijn vragen gerezen over vooringenomenheid als gevolg van (sub)culturele, etnische, levenservaring, en motivationele verschillen. Dit wordt een sociale kwestie wanneer examinandi uit minderheidsgroepen worden vergeleken met een normgroep waarvan de context, waarden en leerervaringen verschillen van die van henzelf (Suzuki en Valencia 1997). Tests verraden daarmee hun oorspronkelijke doel, namelijk het verschaffen van objectieve gegevens over iemands intellectuele functioneren, en komen in plaats daarvan neer op discriminatie van atypische examenkandidaten.
Een ander probleem met psychometrische tests is dat, hoewel zij gewoonlijk onderling sterk correleren, dit niet altijd het geval is (Daniel 1997). Correlaties kunnen worden beïnvloed door welke taken zijn opgenomen en hoe deze worden gewogen. Misschien is het een groter probleem dat zelfs wanneer de testscores hoog correleren, hetzelfde individu op verschillende instrumenten afwijkende scores kan behalen, doordat de tests worden genormeerd op verschillende normeringsgroepen.
Een cruciaal punt van kritiek op psychometrische tests is dat niet is aangetoond dat aanbevelingen die van deze instrumenten zijn afgeleid, de remediëring van de examinandi verbeteren (Reschly 1997). Ook dit kan worden toegeschreven aan het feit dat de inhoud van deze schalen niet is geselecteerd volgens een theorie over intelligentie, hersenwerking of pedagogie.
In andere opzichten heeft het psychometrisch testen succes gehad. Hoewel de testtaken op pragmatische wijze worden geselecteerd, vertonen zij opmerkelijk gelijksoortige clusters in tests en studies, waardoor inzicht wordt verkregen in de structuur van intelligentie. Op basis van statistische methoden die subtests groeperen in clusters volgens onderliggende overeenkomsten (factoranalyse), zijn drie lagen van intelligentie geïdentificeerd (Carrol 1997). Op de hoogste laag staat een algemene factor, g. Deze factor omvat een tweede laag van brede factoren, waaronder “vloeiende” en “gekristalliseerde” intelligentie. (Vloeibare intelligentie omvat het vermogen om met nieuwigheden om te gaan en flexibel te denken. Bij gekristalliseerde intelligentie gaat het om het opslaan en gebruiken van declaratieve kennis zoals woordenschat of informatie). Onder elke brede factor valt een reeks beperkte vaardigheden, zoals “inductie” en “begrijpend lezen”. Kennis van deze verschillende maar onderling afhankelijke lagen kan richting geven aan de constructie van nieuwe psychometrische instrumenten.
Een ander sterk punt van de psychometrische benadering vloeit voort uit de nadruk op kwantitatieve methoden; psychometristen streven ernaar te verzekeren dat hun tests betrouwbare en valide voorspellers van prestaties zijn (Sattler 1992). Betrouwbaarheid” verwijst naar de consistentie van de meting; hoe betrouwbaarder een meting, des te kleiner de fout in de schattingen die ervan worden afgeleid. Veel psychometrische tests kunnen bogen op een zeer hoge interne betrouwbaarheid (de mate waarin elke componentscore van de test correleert met de volledige testscore) en korte-termijn “test-hertest”-betrouwbaarheid (een index van stabiliteit die wordt verkregen door de test meer dan eens aan dezelfde groep personen af te nemen). Bovendien is de stabiliteit van het IQ op lange termijn indrukwekkend gebleken, met goede voorspellingen over een tijdsspanne van 20 jaar. Ook de validiteit van deze tests is sterk gebleken. Validiteit” verwijst naar de mate waarin een test meet waarvoor hij is ontworpen. Scores op intelligentietests correleren met de hoeveelheid schoolopleiding, de kwaliteit van het op school afgeleverde werk, de beroepsstatus en de prestaties in de werksituatie (hoewel de sterkte van de laatste voorspelling controversieel is), zowel gelijktijdig als voorspellend. Samenvattend kan worden gesteld dat, hoewel psychometrische metingen ernstige beperkingen kennen, de benadering betrouwbare en valide schattingen van het intellectueel functioneren oplevert. Psychometrische tests zijn nauwkeurige classificeerders en voorspellers wanneer ze met zorg worden gebruikt in afgebakende contexten.