1 Évaluation psychométrique
Les tests psychométriques ont dominé les tests d’intelligence pendant un siècle. La caractéristique déterminante de cette approche est son fondement empirique ; ” psychométrique ” désigne simplement l’évaluation quantitative d’états/de capacités psychologiques. Si l’évaluation quantitative repose sur une technologie de mesure massive, ses fondements théoriques sont superficiels, comme en témoignent ses origines. Les premiers tests qui ont influencé les mesures intellectuelles contemporaines sont directement issus des études menées par Alfred Binet et ses collègues en France (Cronbach 1984). En 1904, Binet a été chargé d’imaginer un moyen de distinguer les élèves instructibles des élèves non instructibles dans le système d’éducation universel relativement nouveau. Après avoir étudié les indices crâniens, faciaux, palmaires et d’écriture, Binet a découvert la mesure directe des tâches intellectuelles complexes impliquant le jugement, la compréhension et le raisonnement qui permettait le mieux de distinguer les élèves. Sur la base de ces débuts pragmatiques, Binet a défini l’intelligence comme la capacité d’adopter et de maintenir une direction, de faire des adaptations dans le but d’atteindre une fin désirée et de contrôler la performance de manière autocorrective. Peu élaborée, cette définition oriente toujours le paradigme psychométrique.
Typiquement, les tests psychométriques modernes sont constitués de sous-tests variés qui exploitent divers aspects du construit d’intelligence vaguement défini. Par exemple, les échelles peuvent comprendre des sous-tests qui échantillonnent un large éventail de connaissances (par exemple, les noms d’objets, les dates, les faits historiques et géographiques) et exigent du candidat qu’il assemble des blocs de couleur de façon à ce que leur motif ressemble à un dessin préétabli (Sattler 1992). Là encore, le choix des subtests n’est pas guidé par une prescription théorique. Les subtests sont sélectionnés parce qu’ils fonctionnent – en combinaison, ils servent à classer les individus en fonction de leurs connaissances et de leur capacité à résoudre certains problèmes. La sélection pragmatique des subtests est basée sur la conception de Binet de l’intelligence comme une capacité générale ou indifférenciée (g), de sorte que, en principe, les tâches qui exploitent g sont interchangeables.
Au cœur des tests psychométriques se trouve le référencement normatif (Sattler 1992). Les tests à référence normative sont développés en administrant des items de manière standardisée à un échantillon représentatif de la population en question. L’échantillon normatif est considéré comme “représentatif” dans la mesure où il est stratifié au sein des groupes d’âge pour les variables susceptibles d’influencer différemment les performances, telles que le sexe, la région géographique, le statut ethnique, la taille de la communauté, etc. Les scores sont échelonnés de telle sorte que le score dérivé de chaque individu représente une position relative au sein du groupe de normalisation ou de standardisation. En ce sens, le test psychométrique est une entreprise empirique dans son sens le plus pur : en tant que construction comparative, il est peu nécessaire de théoriser sur la nature exacte de l’intelligence.
Comme mentionné, la plupart des tests psychométriques modernes comprennent des tâches variées. A l’origine, l’intention était de s’assurer que le g était sondé de manière exhaustive. Avec le temps, cependant, les cliniciens en sont venus à exploiter la construction multitâche des tests d’intelligence pour faire des distinctions intra-individuelles (Kaufman 1990). En examinant la variabilité entre les sous-tests ou les groupes de sous-tests, les évaluateurs ont formulé des hypothèses sur les forces et les faiblesses intellectuelles relatives. Par exemple, un répondant particulier pourrait s’avérer meilleur dans les tests de mémoire que dans les tâches impliquant la conceptualisation. Il est important de noter, cependant, que l’analyse des différences intra-individuelles s’est développée après coup ; de telles comparaisons sont motivées par les aspects pratiques des subtests disponibles, plutôt que par une théorie détaillée sur la structure de l’intelligence.
La base empirique de l’effort psychométrique implique à la fois une faiblesse et une force. En ce qui concerne ses limites, les tentatives d’interprétation des différences intra-individuelles à partir d’une sélection de subtests choisis de manière pragmatique n’ont pas été validées empiriquement (Reschly 1997). De plus, l’approche athéorique de la sélection des tâches a donné lieu à un échantillonnage restreint et incomplet du domaine de l’intelligence (Chen et Gardner 1997). Par exemple, les capacités musicales et interpersonnelles sont négligées. Au lieu de cela, l’accent est mis sur les compétences acquises par l’apprentissage scolaire, un résultat apprécié dans les sociétés occidentales dominantes. Par conséquent, les critiques s’opposent au fait que les tests psychométriques ne mesurent guère plus que les résultats ; ils évaluent ce qu’un candidat a appris, et non son potentiel d’apprentissage.
Liée à cette question, et amplifiée par la pratique consistant à définir l’intelligence individuelle par rapport à un groupe de référence, des questions ont été soulevées sur les biais dus aux différences (sub)culturelles, ethniques, d’expérience de vie et de motivation. Cela devient un problème social lorsque les candidats issus de groupes minoritaires sont comparés à un échantillon de référence dont le contexte, les valeurs et les expériences d’apprentissage sont différents des leurs (Suzuki et Valencia 1997). Les tests trahissent ainsi leur objectif initial de fournir des données objectives sur le fonctionnement intellectuel d’un individu et en viennent, au contraire, à discriminer les examinateurs atypiques.
Une autre difficulté des tests psychométriques est que, bien qu’ils présentent généralement une forte corrélation entre eux, ce n’est pas toujours le cas (Daniel 1997). Les corrélations peuvent être influencées par les tâches incluses et la façon dont elles sont pondérées. Un problème peut-être plus important réside dans le fait que, même lorsque les résultats des tests présentent une corrélation élevée, le même individu peut obtenir des résultats discordants sur différents instruments en raison du fait que les tests sont normalisés sur différents groupes de standardisation.
Une critique cruciale des tests psychométriques est que les recommandations dérivées de ces instruments n’ont pas été démontrées comme améliorant la remédiation pour les personnes examinées (Reschly 1997). Là encore, cela peut être attribué au fait que le contenu de ces échelles n’a pas été sélectionné en fonction d’une quelconque théorie de l’intelligence, du fonctionnement du cerveau ou de la pédagogie.
A d’autres égards, les tests psychométriques ont rencontré le succès. Bien que les tâches des tests soient sélectionnées de manière pragmatique, elles se regroupent de manière remarquablement similaire entre les tests et les études, ce qui donne un aperçu de la structure de l’intelligence. Sur la base de méthodes statistiques qui regroupent les sous-tests en grappes en fonction de points communs sous-jacents (analyse factorielle), trois strates d’intelligence ont été identifiées (Carrol 1997). À la plus haute strate se trouve un facteur général, g. Ce facteur englobe une deuxième strate de facteurs généraux, dont l’intelligence “fluide” et “cristallisée”. (L’intelligence fluide implique la capacité de faire face à la nouveauté et de penser avec souplesse. L’intelligence cristallisée implique le stockage et l’utilisation de connaissances déclaratives telles que le vocabulaire ou l’information). Sous chaque facteur général se cache un ensemble d’aptitudes spécifiques, telles que l'”induction” et la “compréhension de la lecture”. La connaissance de ces strates distinctes mais interdépendantes peut guider la construction de nouveaux instruments psychométriques.
Une autre force de l’approche psychométrique découle de l’accent mis sur les méthodes quantitatives ; les psychométriciens s’efforcent de garantir que leurs tests sont des prédicteurs fiables et valides de la performance (Sattler 1992). La “fiabilité” fait référence à la cohérence de la mesure ; plus une mesure est fiable, moins les estimations qui en découlent comportent d’erreurs. De nombreux tests psychométriques se targuent d’une fiabilité interne extrêmement élevée (le degré de corrélation entre le score de chaque composante du test et le score total du test) et d’une fiabilité “test-retest” à court terme (un indice de stabilité obtenu en administrant le test au même groupe d’individus plusieurs fois). En outre, la stabilité à long terme du QI s’est avérée impressionnante, avec de bonnes prédictions sur une période de 20 ans. La validité de ces tests s’est également avérée solide. La “validité” fait référence à la mesure dans laquelle un test mesure ce qu’il a été conçu pour mesurer. Les résultats des tests d’intelligence sont en corrélation avec le niveau de scolarisation, la qualité du travail produit à l’école, le statut professionnel et les performances en situation de travail (bien que la force de cette dernière prédiction soit controversée), à la fois de manière concomitante et prédictive. En résumé, bien que la mesure psychométrique présente de sérieuses limites, cette approche permet d’obtenir des estimations fiables et valides du fonctionnement intellectuel. Les tests psychométriques sont des classificateurs et des prédicteurs précis lorsqu’ils sont utilisés avec précaution dans des contextes circonscrits.