1 Evaluación psicométrica
Los tests psicométricos han dominado las pruebas de inteligencia durante un siglo. La característica que define este enfoque es su fundamento empírico; “psicométrico” se refiere simplemente a la evaluación cuantitativa de los estados/capacidades psicológicas. Aunque la evaluación cuantitativa se basa en una tecnología de medición masiva, sus fundamentos teóricos son poco profundos, como se refleja en sus orígenes. Los primeros tests que influyeron en las medidas intelectuales contemporáneas surgieron directamente de los estudios de Alfred Binet y sus colegas en Francia (Cronbach 1984). En 1904, Binet recibió el encargo de idear un medio para distinguir a los alumnos educables de los no educables en el relativamente nuevo sistema educativo universal. Tras investigar los índices craneales, faciales, palmares y de escritura, Binet descubrió que la medida directa de tareas intelectuales complejas que implicaban juicio, comprensión y razonamiento era la que mejor distinguía entre los alumnos. Basándose en estos inicios pragmáticos, Binet definió la inteligencia como la capacidad de adoptar y mantener una dirección, realizar adaptaciones con el fin de alcanzar un objetivo deseado y controlar el rendimiento de forma autocorrectiva. Con poca elaboración, esta definición sigue dirigiendo el paradigma psicométrico.
Típicamente, los tests psicométricos modernos constan de subpruebas variadas que abordan diversos aspectos del constructo de inteligencia definido de forma imprecisa. Por ejemplo, las escalas pueden incluir subpruebas que muestre una amplia gama de conocimientos (por ejemplo, los nombres de los objetos, las fechas, los hechos históricos y geográficos) y que requieran que el examinado ensamble bloques de colores de manera que su patrón se asemeje a un diseño preestablecido (Sattler 1992). Una vez más, la elección de las subpruebas no está motivada por una prescripción teórica. Las subpruebas se seleccionan porque funcionan; en combinación, sirven para clasificar a los individuos según lo que saben y lo buenos que son para resolver ciertos problemas. La selección pragmática de los subtests se basa en la concepción de Binet de la inteligencia como una capacidad general o indiferenciada (g), de modo que, en principio, las tareas que abordan la g son intercambiables.
En el corazón de las pruebas psicométricas se encuentra la referencia a la norma (Sattler 1992). Los tests referenciados a la norma se desarrollan administrando ítems de forma estandarizada a una muestra representativa de la población en cuestión. La muestra normalizada se considera “representativa” en la medida en que está estratificada dentro de los grupos de edad para las variables que podrían influir en el rendimiento de forma diferencial, como el sexo, la región geográfica, la condición étnica, el tamaño de la comunidad, etc. Las puntuaciones se escalan de manera que la puntuación derivada de cada individuo represente una posición relativa dentro de la norma o grupo de estandarización. En este sentido, las pruebas psicométricas son un esfuerzo empírico en su sentido más puro: como constructo comparativo, hay poca necesidad de teorizar sobre la naturaleza exacta de la inteligencia.
Como se ha mencionado, la mayoría de las pruebas psicométricas modernas incluyen tareas variadas. La intención original era asegurar que g fuera encuestada de forma exhaustiva. Con el tiempo, sin embargo, los clínicos llegaron a explotar la construcción de tareas múltiples de las pruebas de inteligencia para hacer distinciones intraindividuales (Kaufman 1990). Al observar la variabilidad entre subpruebas o grupos de subpruebas, los evaluadores formularon hipótesis sobre las fortalezas y debilidades intelectuales relativas. Por ejemplo, un encuestado concreto podría ser mejor en las pruebas de memoria que en las tareas de conceptualización. Sin embargo, es importante tener en cuenta que el análisis de las diferencias intraindividuales se desarrolló a posteriori; estas comparaciones están impulsadas por los aspectos prácticos de las subpruebas disponibles, más que por una teoría detallada sobre la estructura de la inteligencia.
La base empírica del esfuerzo psicométrico implica tanto debilidades como fortalezas. En cuanto a sus limitaciones, los intentos de interpretar las diferencias intraindividuales a partir de una selección de subtests elegidos pragmáticamente no han sido validados empíricamente (Reschly 1997). Además, el enfoque ateórico de la selección de tareas ha dado lugar a un muestreo restringido e incompleto del dominio de la inteligencia (Chen y Gardner 1997). Por ejemplo, se descuidan las habilidades musicales e interpersonales. En cambio, se hace hincapié en las habilidades adquiridas mediante el aprendizaje académico, un resultado muy apreciado en las sociedades occidentales dominantes. Por lo tanto, los críticos se oponen al hecho de que los tests psicométricos miden poco más que el rendimiento; evalúan lo que un examinado ha aprendido, no el potencial del examinado para aprender.
En relación con esta cuestión, y magnificada por la práctica de definir la inteligencia individual con referencia a un grupo normativo, han surgido preguntas sobre el sesgo debido a las diferencias (sub)culturales, étnicas, de experiencia vital y de motivación. Esto se convierte en un problema social cuando los examinados de grupos minoritarios se comparan con una muestra estándar cuyo contexto, valores y experiencias de aprendizaje son diferentes a los suyos (Suzuki y Valencia 1997). De este modo, las pruebas traicionan su propósito original de proporcionar datos objetivos sobre el funcionamiento intelectual de un individuo y llegan, en cambio, a discriminar a los examinados atípicos.
Otra dificultad de las pruebas psicométricas es que, aunque suelen tener una alta correlación entre sí, no siempre es así (Daniel 1997). Las correlaciones pueden estar influenciadas por las tareas que se incluyen y por cómo se ponderan. Tal vez un problema mayor reside en el hecho de que, incluso cuando las puntuaciones de las pruebas tienen una alta correlación, el mismo individuo puede obtener puntuaciones discrepantes en diferentes instrumentos debido al hecho de que las pruebas se normalizan en diferentes grupos de estandarización.
Una crítica crucial a las pruebas psicométricas es que no se ha demostrado que las recomendaciones derivadas de estos instrumentos mejoren la corrección de los examinados (Reschly 1997). Una vez más, esto puede atribuirse al hecho de que el contenido de estas escalas no ha sido seleccionado de acuerdo con ninguna teoría de la inteligencia, el funcionamiento del cerebro o la pedagogía.
En otros aspectos, las pruebas psicométricas han tenido éxito. Aunque las tareas de las pruebas se seleccionan de forma pragmática, se agrupan de forma notablemente similar en todas las pruebas y estudios, lo que permite comprender la estructura de la inteligencia. Sobre la base de métodos estadísticos que agrupan las subpruebas en clusters según los puntos comunes subyacentes (análisis factorial), se han identificado tres estratos de inteligencia (Carrol 1997). En el estrato más alto hay un factor general, g. Este factor subsume un segundo estrato de factores amplios, que incluyen la inteligencia “fluida” y la “cristalizada”. (La inteligencia fluida implica la capacidad de hacer frente a la novedad y pensar con flexibilidad. La inteligencia cristalizada implica el almacenamiento y la utilización de conocimientos declarativos, como el vocabulario o la información). Dentro de cada factor amplio hay un conjunto de capacidades limitadas, como la “inducción” y la “comprensión lectora”. El conocimiento de estos estratos distintos pero interdependientes puede guiar la construcción de nuevos instrumentos psicométricos.
Otro punto fuerte del enfoque psicométrico se deriva de su énfasis en los métodos cuantitativos; los psicómetras se esfuerzan por garantizar que sus pruebas sean predictores fiables y válidos del rendimiento (Sattler 1992). La “fiabilidad” se refiere a la consistencia de la medición; cuanto más fiable sea una medida, menos error habrá en las estimaciones derivadas de ella. Muchos tests psicométricos cuentan con una fiabilidad interna extremadamente alta (el grado en que la puntuación de cada componente del test se correlaciona con la puntuación del test completo) y una fiabilidad “test-retest” a corto plazo (un índice de estabilidad derivado de la administración del test al mismo grupo de individuos más de una vez). Además, la estabilidad a largo plazo del CI ha demostrado ser impresionante, con buenas predicciones a lo largo de 20 años. La validez de estas pruebas también ha demostrado ser sólida. La “validez” se refiere a la medida en que una prueba mide lo que fue diseñada para medir. Las puntuaciones de los tests de inteligencia se correlacionan con la cantidad de estudios, la calidad del trabajo realizado en la escuela, el estatus profesional y el rendimiento en el trabajo (aunque la fuerza de esta última predicción es controvertida), tanto de forma concurrente como predictiva. En resumen, aunque las mediciones psicométricas tienen serias limitaciones, el enfoque produce estimaciones fiables y válidas del funcionamiento intelectual. Los tests psicométricos son clasificadores y predictores precisos cuando se utilizan con cuidado en contextos circunscritos.