Introduccion a La Psicometria

INTRODUCCIN A LA PSICOMETRA

SILVIA TORNIMBENIEDGARDO PREZ

FABIN OLAZ(compiladores)

Con la colaboracin deNURIA CORTADA DE KOHAN

ALBERTO FERNNDEZMARCOS CUPANI

INTRODUCCIN A LA PSICOMETRA

PAIDSBuenos Aires

BarcelonaMxico

Los autores ...................................................................................... 9Prlogo, Prof. Livio Grasso ............................................................. 11Prefacio ........................................................................................... 13

Primera ParteFundamentos de la medicin en psicologa

1. Problemtica de la medicin psicolgica................................... 191.1. La medicin en psicologa ................................................. 191.2. Psicometra y tests psicolgicos ........................................ 211.3. Resea histrica ................................................................ 28

2. Clasificacin de los tests............................................................ 392.1. Tests de ejecucin mxima: inteligencia, aptitudes

y habilidades...................................................................... 402.2. Tests de comportamiento tpico: motivacin,

actitudes y personalidad .................................................. 49

Segunda ParteNormas tcnicas

Introduccin..................................................................................... 693. Confiabilidad.............................................................................. 71

3.1. Introduccin....................................................................... 713.2. El concepto de confiabilidad en la teora clsica

de los tests ......................................................................... 723.3. Principales factores que afectan la confiabilidad............. 763.4. Dimensiones de la confiabilidad ....................................... 80

Introduccin a la psicometra / Silvia Tornimbeni...[et.al.]. - 1a ed. - Buenos Aires : Paids,2008. 288 p. ; 22x16 cm. (Evaluacin Psicolgica; 21085)

ISBN 978-950-12-6085-4

1. Psicologa. 2. Psicometra.CDD 153.9

Cubierta de Gustavo Macri

1 edicin, 2008

Queda rigurosamente prohibida, sin la autorizacin escrita de los titulares delcopyright, bajo las sanciones establecidas en las leyes, la reproduccin parcialo total de esta obra por cualquier medio o procedimiento, comprendidos lareprografa y el tratamiento informtico.

2008 de todas las edicionesEditorial Paids SAICFDefensa 599, Buenos Airese-mail: [email protected]

Queda hecho el depsito que previene la ley 11.723Impreso en la Argentina. Printed in Argentina

Impreso en Primera Clase, California 1231, Ciudad de Buenos Airesen febrero de 2008

Tirada: 3.000 ejemplares

ISBN: 978-950-12-6085-4

NDICE

SILVIA TORNIMBENILicenciada en Psicologa, especialista en Psicometra y Psi-

cologa Educacional. Profesora titular de la ctedra Tcnicas yPsicomtricas y miembro del Consejo Directivo, Facultad dePsicologa, Universidad Nacional de Crdoba. Posee una exten-sa trayectoria en gestin, evaluacin y formacin de recursoshumanos. Autora de libros, captulos de libros y numerosas pu-blicaciones acadmicas. Investigadora en el Programa de Incen-tivos SECyT.

EDGARDO PREZDoctor en Psicologa, especialista en Psicometra y Desarro-

llo de Carrera. Profesor adjunto de la ctedra Tcnicas Psico-mtricas y miembro del Comit Acadmico de la Carrera deDoctorado, Facultad de Psicologa, Universidad Nacional deCrdoba. Autor de libros, captulos de libros y artculos en revis-tas nacionales e internacionales. Director de tesis de grado yposgrado, as como de becas de investigacin SECyTy Conicet.Investigador en el Programa de Incentivos de SECyT.

FABIN OLAZLicenciado en Psicologa, especialista en Psicometra y Teora

Social Cognitiva. Becario de Conicet. Profesor de la ctedra Tc-nicas Psicomtricas, Facultad de Psicologa, Universidad SigloXXI. Autor de libros, captulos de libros y artculos en revistasnacionales e internacionales.

3.5. Mtodos para verificar la confiabilidad............................ 813.6. Confiabilidad y puntuaciones individuales ...................... 943.7. Confiabilidad en la teora de respuesta al tem

(TRI) y en los test con referencia a criterio (TRC) ........... 96

4. Validez ...................................................................................... 1014.1. Introduccin....................................................................... 1014.2. Fuentes de evidencia de validez ...................................... 1034.3. Utilidad de los tests en contextos de clasificacin ........... 1254.4. Generalizacin de la validez: el meta-anlisis ................. 132

5. Interpretacin de puntuaciones ............................................... 1375.1. Interpretacin referida a normas ..................................... 1375.2. Otros mtodos de interpretacin de puntuaciones ........... 153

6. Construccin de tests................................................................. 1616.1. Definicin del dominio ...................................................... 1626.2. Redaccin de los tems ..................................................... 1646.3. Revisin de expertos.......................................................... 1686.4. Anlisis factorial y de tems ............................................ 169

7. Adaptacin de tests a otras culturas......................................... 1917.1. Por qu adaptar tests ........................................................ 1917.2. Fuentes de sesgo................................................................ 1937.3. La influencia del lenguaje................................................. 1967.4. Mtodos de adaptacin...................................................... 197

Tercera parteTeora de los tests

8. Teora clsica de los tests .......................................................... 2099. Teora de respuesta al tem ....................................................... 217

Apndice: Anlisis psicomtricos con SPSS .......................... 2451. Correlacin bivariada ................................................................ 2462. Coeficiente alfa de Cronbach..................................................... 2533. Anlisis de regresin mltiple................................................... 258

Referencias bibliograficas ......................................................... 269

8 INTRODUCCIN A LA PSICOMETRA

LOS AUTORES

Este libro es una introduccin a la psicometra en un doblesentido: por un lado, permite adentrarse en los temas e instru-mentos clsicos de la disciplina y, por otro, ofrece un panoramade los desarrollos ms actuales, tales como los tests informati-zados.

Se tratan aqu los temas bsicos relacionados con la confiabi-lidad y la validez, y otros ms avanzados como el met-analisisy el anlisis factorial. Este ltimo mtodo, fundamental en eldesarrollo actual de la psicometra, es objeto de una presenta-cin bsica pero reflexiva y completa, que asegura la compren-sin de sus objetivos, fundamentos y aplicaciones. Con respectoa los instrumentos de medicin psicolgica, se analizan pruebastradicionales (por ejemplo, los tests de inteligencia) y tambinotras concebidas para la evaluacin de constructos de recienteinters, como las creencias de autoeficacia.

La atencin a los mtodos multivariables, de inmensa impor-tancia hoy, es tambin una caracterstica de este libro. A la con-sideracin del anlisis factorial, ya mencionada, se agrega unapresentacin del anlisis de regresin mltiple, de especial sig-nificacin en los estudios de validez.

El libro contiene exposiciones accesibles, con nfasis en losfundamentos conceptuales. Los temas son abordados de mane-ra de hacer posibles las aplicaciones por parte del lector. Estapreocupacin impregna toda la obra y merece tambin seccionesespeciales como las dedicadas a la adaptacin de tests a otrasculturas (de enorme importancia en pases como el nuestro) y aprocedimientos informticos de especial inters para la psico-metra contempornea.

PRLOGO

El desarrollo de nuestra ciencia seguir probablemente elmodelo de toda ciencia, hacindose cada vez ms matem-tica a medida que las ideas fundamentales se formulen demanera ms rigurosa.

L. L. THURSTONE

Hace algunos aos realizamos una encuesta para investigar eluso de tests por parte de psiclogos y psicopedagogos de la ciudadde Crdoba, Argentina (Prez y Gay, 1991). Una de las principa-les conclusiones de ese estudio fue que exista una necesidad im-periosa de especialistas capacitados para construir tests en basea las necesidades de nuestra comunidad, as como para adaptaraqullos elaborados en otros pases. Tambin pudimos identificarque la mayora de los profesionales entrevistados realizaban unuso tcnicamente inadecuado de los tests. Ms recientemente,Fernndez, Marino, Villacorta y Prez (2000) replicaron esta in-vestigacin con resultados similares. En efecto, solamente la mi-tad de los encuestados inform utilizar tests en sus actividadesprofesionales y un elevado porcentaje de los entrevistados nootorgaba la importancia debida a los requisitos tcnicos y funda-mentos tericos de las pruebas psicomtricas que utilizaban. Pa-ra evitar este empleo inapropiado de los tests es esencial que losestudiantes de psicologa y carreras afines, as como los profesio-nales usuarios de pruebas psicolgicas, adquieran y/o incremen-ten su formacin en la teora y tcnica de los tests.

Este libro intenta realizar una contribucin acotada en esesentido, como herramienta bsica de consulta en nuestra re-

PREFACIOCelebro el lugar que las consideraciones tericas tienen eneste libro. As, por ejemplo, se bosquejan diversas concepcionesactuales sobre la estructura de la inteligencia y otros plantea-mientos que han tenido importantes aplicaciones en psicome-tra, como la teora social-cognitiva de Bandura. A la presenta-cin de la concepcin clsica de los tests sigue una exposicinsinttica de la teora de respuesta al tem, de especial inters ysignificacin actuales.

Creo que el texto resultar valioso para el estudiante y tam-bin para quienes se interesen por las cuestiones metodolgicasy epistemolgicas relativas a la posibilidades de matematiza-cin en las ciencias del comportamiento. Adicionalmente, ofreceal estudioso un panorama de los aportes al desarrollo y la adap-tacin de pruebas psicolgicas realizados en nuestro pas, gene-ralmente poco conocidos.

Prologo este libro con profunda satisfaccin. Los textos sobrela materia en idioma ingls son abundantes. Esta obra, fruto dela labor de investigadores y docentes de la Univesidad Nacionalde Crdoba, extiende la bibliografa en idioma castellano y laenriquece de manera apreciable.

PROFESOR LIVIO GRASSOFacultad de Psicologa

Universidad Nacional de Crdoba


sultan indispensables para comprender la lgica de un procedi-miento estadstico determinado.

Los docentes que usen este texto deberan complementarlocon actividades de prctica de administracin y calificacin detests, con la lectura crtica de manuales de tests y artculos derevistas cientficas relacionados con la psicometra en diferen-tes contextos aplicados de la psicologa, as como con anlisis dedatos psicomtricos en programas estadsticos computarizados.

Quisiramos agradecer a todos los colegas y estudiantes quecon sus observaciones crticas y comentarios a nuestros mate-riales impresos previos nos permitieron mejorar la claridad con-ceptual y expositiva de este manual. Un reconocimiento espe-cial a Leonardo Medrano, ayudante alumno de la ctedra, quienprest una valiosa colaboracin en la elaboracin de los grficosincluidos en este texto. Tambin result esencial la lectura cr-tica realizada por el profesor Livio Grasso, cuyas observacionesy sugerencias fueron especialmente tiles para mejorar la inte-ligibilidad del texto.

SILVIA TORNIMBENIEDGARDO PREZ

FABIN OLAZFacultad de Psicologa

Universidad Nacional de Crdoba

PREFACIO 15

gin, y est pensado para un lector sin conocimientos psicom-tricos aunque con formacin bsica en estadstica aplicada a laciencia del comportamiento. En efecto, la psicometra es en granmedida una estadstica aplicada y, por consiguiente, requiere lacomprensin de trminos bsicos tales como medidas de tenden-cia central y dispersin, niveles de medicin, correlacin entrevariables, curva normal y probabilidad, entre otros. No obstan-te, algunos de estas nociones se repasan sintticamente en losdiferentes captulos de este texto.

El investigador dedicado a la construccin, adaptacin detests o a la investigacin psicomtrica puede utilizar esta publi-cacin como material inicial que le facilite la consulta posteriora textos ms especializados, algunos de los cuales mencionamosrepetidamente en este manual (Anastasi y Urbina, 1998; Cron-bach, 1998; Hogan, 2004; Kline, 2000; Muiz, 2001; Aiken,2003; Martnez Arias, 1995; APA, 1999, por ejemplo). Otra ca-racterstica distintiva de este manual introductorio es la men-cin continua de los tests desarrollados o adaptados en el pas.Esta informacin debera ser de utilidad para el estudioso de lapsicometra o el usuario de tests, quienes muchas veces desco-nocen la produccin local en esta disciplina.

La primera parte del volumen aborda la controvertida pro-blemtica de la medicin en psicologa. En esta primera seccintambin se describe sintticamente la evolucin histrica de lostests, as como una propuesta de clasificacin de estos instru-mentos de medicin, incluyendo algunas referencias al trabajorealizado en la Argentina para construir y adaptar tests. La se-gunda parte desarrolla nociones fundamentales relacionadascon los requisitos tcnicos que deben reunir los tests para suuso en situaciones reales de evaluacin de personas: confiabili-dad, validez, interpretacin de las puntuaciones, construccin yadaptacin de tests, en ese orden. Finalmente, en la terceraparte se revisan las teoras de los tests psicolgicos: la teoraclsica de los tests y la teora de respuesta al tem. Un apndi-ce complementa el texto, ilustrando algunos anlisis psicomtri-cos esenciales mediante el empleo de software estadstico.

Puesto que todos los clculos se realizan actualmente me-diante programas informticos, intentamos incluir la menorcantidad de frmulas posible, presentando slo aquellas que re-


PRIMERA PARTE

FUNDAMENTOS DE LA MEDICIN EN PSICOLOGA

1.1. La medicin en psicologa

Si bien muchos textos de psicometra comienzan definiendolos tests psicolgicos, creemos necesario partir de un conceptoprevio y ms general de medicin. El problema de la medicinposiblemente es ms controversial en psicologa que en otros do-minios del conocimiento, debido a la complejidad del comporta-miento humano y las limitaciones de los instrumentos utilizadosen esa disciplina. En la actualidad an no existe consenso en lacomunidad psicolgica acerca del estatus terico de la medicin.

Estas divergencias se originan en diferentes posturas filos-ficas referentes al conocimiento cientfico y las formas ptimasde construirlo. Las distintas posiciones tericas acerca de la na-turaleza de la medicin autntica varan de acuerdo a las di-versas concepciones acerca de la ciencia, las cuales a su vez es-tn determinadas por diferentes enfoques sobre la naturalezahumana y la realidad.

Analizando la historia y la filosofa del concepto de medicinen psicologa, se pueden distinguir dos modelos fundamentales:el clsico y el representacional, cada uno con diferentes perspec-tivas sobre el significado general de la medicin y el estatuscientfico de la medicin psicolgica.

Modelo clsico

En el intento de construccin de una metodologa objetiva,algunos cientficos sociales han adoptado una actitud de plena

1PROBLEMTICA DE LA MEDICIN PSICOLGICA

Silvia Tornimbeni - Fabin Olaz - Edgardo Prez

cientfica. Esta concepcin restrictiva limita la medicin en psi-cologa, puesto que la mayora de las escalas utilizadas en estadisciplina no poseen cero absoluto, las propiedades medidas ca-si nunca son isomrficas con el sistema numrico y, por consi-guiente, las operaciones de medicin son casi siempre derivadas.

Otros autores contemporneos, tales como Kline (2000) yMario Bunge (1983), podran ser incluidos en este modelo clsi-co de medicin aunque no adhieran a una concepcin tan res-trictiva como la formulada por Campbell. Bunge afirma quecuantificar significa proyectar el conjunto de grados de una pro-piedad sobre un conjunto de nmeros de modo tal que la orde-nacin y el espaciamiento de los nmeros refleje el orden y el es-paciamiento de los grados de la propiedad; y medir significadeterminar efectivamente algunos de esos valores numricosmediante el uso de una escala. Para Bunge, la medicin propia-mente dicha requiere escalas con cero absoluto y unidades demedidas que pertenezcan a un sistema tericamente fundado.

No obstante, Bunge y Ardila (2002) reconocen que en la ma-yora de los casos, en ciencia, las propiedades a medir son inac-cesibles a la observacin directa (las capacidades mentales o lasmasas atmicas, por ejemplo). Cuando la medicin es indirectadebe realizarse utilizando indicadores operacionales adecuados,es decir: propiedades observables legalmente ligadas a otrasinobservables (p. 83). En ese sentido, la concentracin de nora-drenalina en sangre sera un indicador (observable) del estrs(inobservable) o, del mismo modo, el movimiento rpido del ojoun indicador del sueo.

El problema en psicologa, para Bunge y Ardila, es que mu-chos constructos es decir, conceptos tericos que no son direc-tamente observables y sus indicadores operacionales no hansido definidos ni explicados claramente por teoras cientficas y,por consiguiente, la medicin no slo es indirecta (lo cual no se-ra un problema grave) sino meramente emprica y ambigua. Enrealidad, no existe una clasificacin objetiva y fiable de la inte-ligencia o la personalidad; de hecho, una de las caractersticasde la psicologa contempornea es su fuerte fragmentacin ensistemas o escuelas rivales. Como veremos ms adelante,constructos importantes para la psicologa son definidos de ma-nera diferente por teoras competidoras. Coincidentemente,

PROBLEMTICA DE LA MEDICIN PSICOLGICO 21

aceptacin del paradigma de las ciencias naturales. En 1940, enun seminario de expertos en medicin psicolgica (Campbell,1938) se elabor un informe en el cual se pona en duda la posi-bilidad de medir atributos psicolgicos, debido a que en estecampo no existe isomorfismo entre las operaciones de medida ylas magnitudes de la propiedad a medir (Muiz, 1998). El con-cepto de isomorfismo corresponde a la equivalencia entre el or-den y la distancia de los niveles de una propiedad cualquiera ydel sistema numrico utilizado para medirla.

Por medicin se entiende la observacin de propiedades cuan-titativas, tales como las frecuencias o concentraciones (Bunge yArdila, 2002). En el modelo clsico (no debe confundirse con lateora clsica de los tests que se desarrolla al final de este libro)se postula que, para ser mensurables, esas propiedades debenposeer las caractersticas de una variable cuantitativa. Desde es-ta perspectiva, propiedades tales como masa o peso pueden sermedidas, pero la medicin de otras como personalidad o inteli-gencia, por ejemplo, es ms problemtica puesto que no son va-riables estrictamente cuantitativas.

Para que una variable sea cuantitativa debe poseer las carac-tersticas de distintividad, orden, aditividad y proporcionalidad(se pueden realizar juicios del tipo A + B C + D). Slo en el ca-so de que se pueda demostrar en forma emprica que una pro-piedad posee estas caractersticas, podramos hablar de medi-cin en sentido estricto.

Segn Campbell (1938), la medicin puede ser fundamentalo derivada. Estas categoras determinan el significado de lossmbolos numricos empleados para medir. Las mediciones fun-damentales no requieren otras medidas para ser expresadas(por ejemplo, las de variables como la longitud o el peso). Lasvariables medidas fundamentalmente poseen significado cons-titutivo y operacional por s mismas, es decir que uno no debe-ra asignar nmeros para medir una propiedad sino descu-brir su magnitud. Por el contrario, las mediciones derivadasson aquellas que para poder ser expresadas necesitan de otrasmedidas (para medir la densidad es necesario conocer previa-mente el volumen y la masa, por ejemplo).

Campbell afirma que la medicin fundamental o directa debeocupar un lugar central en toda disciplina que pretenda ser


deben ser exhaustivas (abarcar todos los objetos que incluyen) ymutuamente excluyentes (un objeto no puede estar en ms deuna categora). En esta escala los nmeros asignados a cada ca-tegora no representan ms que una etiqueta, de forma tal quepodramos utilizar letras o cualquier otro smbolo (en lugar denmeros) para diferenciar un grupo de otro. Las nicas opera-ciones numricas permitidas en este nivel de medicin son elmodo (para representar la tendencia central), los coeficientes decontingencia (para las relaciones entre variables) y las distribu-ciones de frecuencia.

El segundo tipo de relacin es la de orden, vale decir que losobjetos incluidos en una categora no solamente difieren de losde otra sino que adems pueden ser ordenados. Este tipo de es-calamiento se denomina ordinal, y un ejemplo sera el niveleducativo (primario, secundario, terciario) o el estatus socioeco-nmico (bajo, medio bajo, medio, medio alto, alto). En cuanto alas propiedades formales, la escala ordinal incluye tanto la rela-cin de equivalencia como la relacin de orden (ms grande que,o mayor que). En esta escala no existen intervalos iguales y, porconsiguiente, no puede asegurarse que la distancia entre dospuntos de la escala (2 y 4, por ejemplo) sea equivalente a la exis-tente entre otros dos (5 y 7, por ejemplo). Esto implica que ope-raciones como la suma y la resta no son admisibles en este nivelde medicin. Las estadsticas que se admiten son la mediana yla correlacin de rangos.

Un tercer nivel de medicin es aquel en el cual se puede asu-mir la existencia de intervalos iguales en la escala de medicin.As, por ejemplo, en los primeros experimentos llevados a caboen el campo de la psicofsica se solicitaba a un individuo que es-timara si la diferencia en magnitud entre un par de estmulosera tan grande como la diferencia en magnitud entre otros dosestmulos. La escala numrica que permite representar este ti-po de relacin se denomina intervalar. En este nivel de medi-cin tenemos categoras diferentes (como en la escala nominal),orden (como en la escala ordinal) y distancias numricas que secorresponden con distancias empricas equivalentes en las va-riables que se desea medir, aunque el origen de la escala es ar-bitrario (Cortada de Kohan, 1999). En una escala de intervalo,la distancia entre 2 y 4 es la misma que entre 21 y 23. La suma


Kaplan y Saccuzzo (2006) expresan que los tests psicolgicos nopueden ser mejores que las teoras y supuestos en los que sebasan. Para Kline (2000), los tests psicolgicos no son instru-mentos cientficos como los utilizados en las ciencias naturales(puesto que carecen de cero absoluto, unidades de medicin sig-nificativas y no miden variables cuantitativas), aunque poseenun indiscutible valor pragmtico en la psicologa aplicada (ocu-pacional o educacional, por ejemplo); por consiguiente, no debe-ran ser abandonados hasta que la psicologa disponga de teo-ras biolgicas y cognitivas vlidas que le permitan elaborarherramientas de medicin superiores a los tests.

Modelo representacional

En el modelo representacional, los nmeros utilizados en lamedicin no representan propiamente cantidades sino relacio-nes (Mitchell, 1990; Stevens, 1949). Este enfoque distingue en-tre un sistema relacional emprico (X), un sistema relacionalnumrico (R) y una aplicacin de X en R. El sistema relacionalemprico hace referencia al conjunto de indicadores de un cons-tructo y las relaciones entre los mismos y el sistema relacionalnumrico; al conjunto de nmeros y sus relaciones, los que pue-den ser usados para representar las relaciones observadas entrelos objetos o propiedades (Aftanas, 1988). En el contexto de estemodelo, medir significa utilizar el sistema numrico para repre-sentar relaciones empricas (asignar nmeros) aunque no exis-ta isomorfismo entre ambos sistemas.

Para comprender la afirmacin precedente, consideremos di-ferentes clases de relaciones empricas. El primer tipo es la re-lacin de equivalencia, esto es, los objetos son equivalentes enuna propiedad determinada, por lo cual forman parte de unamisma categora, y difieren en esta propiedad de los miembrosde otras categoras. Por ejemplo, consideremos el caso de unaclasificacin por zona de residencia (urbano-rural), en dondeasignamos un 1 a la categora urbano y un 2 a la categora ru-ral. La escala de medicin utilizada para representar relacionesde equivalencia se denomina nominal, y como se aprecia en elejemplo, la operacin bsica es la clasificacin. Las categoras


ejemplo). Por este motivo, el coeficiente de correlacin (uno delos datos estadsticos fundamentales de la psicometra) y todoslos mtodos relacionados (anlisis factorial, anlisis de regre-sin mltiple) slo pueden utilizarse en escalas que alcancen(mnimamente) un nivel intervalar de medicin.

El modelo representacional admite diferentes niveles de medicin que dependendel tipo de escala (nominal, ordinal, intervalar, proporcional) empleada para mediruna propiedad. sta es una diferencia esencial con respecto a los autores que de-fienden una concepcin clsica de medicin quienes postulan que la medicin, au-tntica tiene lugar slo cuando se miden variables cuantitativas utilizando una esca-la proporcional o de razn.

Podra concluirse que el modelo clsico representa un estn-dar ptimo pero difcilmente alcanzable en la actualidad, y elmodelo representacional una solucin de compromiso ms facti-ble en el estado actual de la psicometra. Los tests psicolgicosrepresentan un avance considerable en objetividad, confiabili-dad y capacidad predictiva con relacin a otros mtodos de eva-luacin (entrevista clnica, por ejemplo) pero requieren teorasvlidas y explicativas (no meramente descriptivas) de los cons-tructos e indicadores que pretenden medir para constituirse eninstrumentos plenamente cientficos.

1.2. Psicometra y tests psicolgicos

Por todo lo expresado anteriormente se comprender queuna de las reas fundamentales de la psicologa es la psicome-tra, que se ocupa de los procedimientos de medicin del com-portamiento humano, incluyendo a los denominados tests psico-lgicos. Para Muiz (2001), la teora de los tests (que veremosen el ltimo captulo) es slo uno de los campos de la psicome-tra, que adems comprende la teora de la medicin o funda-mentacin terica de las operaciones de medida (abordada sin-tticamente en el apartado anterior) y la estadstica aplicada ala construccin y anlisis psicomtrico de los instrumentos demedicin.


y la resta son operaciones legtimas pero no as la multiplica-cin y divisin y, por consiguiente, 60 no representa el doble de30 ni la mitad de 120 en este nivel de medicin. Un ejemplo tpi-co de escala intervalar es el termmetro Fahrenheit (donde el ce-ro es relativo y arbitrario puesto que no indica la ausencia abso-luta de calor). En psicologa, en general, los resultados de lostests son tratados como datos de una escala intervalar aunqueoriginalmente provengan de escalas ordinales. En efecto, comoveremos ms adelante si las puntuaciones de un test se distribu-yen normalmente, la conversin de las puntuaciones originales apuntuaciones z resulta en unidades que pueden considerarsecuantitativamente iguales (Kerlinger y Lee, 2002). Estadsticasparamtricas como la desviacin estndar, la media y el coefi-ciente de correlacin lineal son admisibles en este nivel de me-dicin.

Un ltimo tipo de relacin es aquel en el cual existe un ceroabsoluto con significado emprico, es decir que el cero en la esca-la de medicin representa la ausencia absoluta de una propie-dad. Esta escala se denomina de razn o proporcional y per-mite realizar todas las operaciones matemticas, incluyendo lamultiplicacin y la divisin. Los nmeros de una escala de raznindican las cantidades reales de la propiedad medida, y la longi-tud o el peso son variables que se miden utilizando escalas de es-te tipo. La escala de razn tiene todas las caractersticas de unaescala de intervalo, pero adems posee un cero absoluto o natu-ral en su origen, por lo cual, un cambio en la unidad de medidano altera los juicios acerca de los valores absolutos de los atribu-tos. En psicologa, por ejemplo, el empleo de una escala de raznpermitira expresar que un individuo con una puntuacin de 8en un test X posee el doble de la propiedad P que otro individuoque obtuvo una puntuacin de 4 en ese test. Sin embargo, este ti-po de afirmaciones resultan inadecuadas para la mayora de lostests psicolgicos puesto que los datos con los que trabajan loscientficos sociales no son ni siquiera aproximados a los requeri-dos para el uso de una escala de razn (Kerlinger y Lee, 2002).

Como puede deducirse de lo anterior, los nmeros utilizadospara representar un tipo de relacin (equivalencia, por ejemplo)no pueden ser tratados estadsticamente de la misma forma quelos utilizados para representar otro tipo de relacin (orden, por


de medicin, aunque lo opuesto tambin es una realidadconstatable en la historia de la ciencia.

Los ndices numricos utilizados por los tests permiten co-municar los resultados de una evaluacin con mayor preci-sin. De este modo, los tests proporcionan discriminacio-nes ms sutiles que la clasificacin intuitiva que unmaestro podra hacer de sus estudiantes, incluyndolos encategoras poco discriminativas como brillante, prome-dio o debajo del promedio, por ejemplo.

El desarrollo de tests es un proceso complejo, pero el resul-tado final es un procedimiento estandarizado ms sencilloy breve que la observacin. Pensemos, en relacin con estaltima aseveracin, en el tiempo requerido para adminis-trar y puntuar un test en comparacin con el tiempo quedemandara la observacin del desempeo o comporta-miento de una persona en su ambiente natural (escuela otrabajo, por ejemplo).

La delimitacin del concepto de tests psicolgicos no es senci-lla, y a lo largo de la historia de la psicologa ha suscitado innu-merables polmicas. El trmino ingls test (prueba, examen)proviene del vocablo latino testa-testis, que denominaba una ba-lanza utilizada en la antigedad para pesar vasijas de oro (Cor-tada de Kohan, 1999).

De acuerdo con Anastasi y Urbina (1998), un test es un ins-trumento de medicin del comportamiento de un individuo, apartir del cual pueden inferirse otros comportamientos relevan-tes. En 1999 la American Psychological Association (en adelan-te APA) defini a los tests como un procedimiento por medio delcual una muestra de comportamiento de un dominio especifica-do es obtenida y posteriormente puntuada, empleando un proce-so estandarizado. Esta definicin comprende no slo a los testsde ejecucin mxima, donde las respuestas son evaluadas porsu correccin y calidad sino tambin a los de comportamiento t-pico (inventarios de personalidad, por ejemplo) siempre que res-peten el postulado anterior.

El concepto de evaluacin es ms comprensivo que el detest y se refiere al proceso que permite integrar la informacinobtenida por medio de tests con la proveniente de otras fuentes,


Los tests psicolgicos se construyen, en general, para medirconstructos que no pueden observarse directamente. Nunnallyy Bernstein (1995) afirmaron que nunca se miden las personassino algunos de sus atributos, es decir, caractersticas particula-res de los individuos. En psicologa nadie se propone medir unnio, sino su inteligencia, estabilidad emocional o autoestima,por ejemplo. Por otro lado, las operaciones de medicin en psico-loga son casi siempre indirectas, vale decir, suponen la deter-minacin de los indicadores del fenmeno a medir.

Como argument Martnez Arias (1995), el estatus actual dela psicologa genera una serie de dificultades para el desarrollode instrumentos cientficos de medicin, a saber:

a) Un mismo constructo psicolgico puede ser definido demanera diferente, por lo cual distintos procedimientos demedida pueden conducir a inferencias dismiles en rela-cin a aqul.

b) Es difcil determinar las caractersticas de una muestrade elementos (tems) de un test para que sea representati-va, en cuanto a extensin y variedad de contenidos, del do-minio o constructo que se quiere medir.

c) Como consecuencia de lo expresado en los puntos anterio-res siempre existen errores en las medidas.

d) Las escalas de medicin usadas en psicologa carecen, ca-si siempre, de cero absoluto y de unidades de medidasconstantes.

Aun con estas deficiencias, el nivel de precisin alcanzadopor la medicin en psicologa permite exhibir algunas ventajasrespecto a la observacin natural o no formal del comportamien-to, entre ellas:

Una de las principales es la objetividad, que implica queuna afirmacin fctica es posible de verificar por otroscientficos en forma independiente.

La posibilidad de medicin de las variables facilita el de-sarrollo de investigaciones. Segn Nunnally (1991), losavances en las ciencias en general, y en la psicologa enparticular, se relacionan con los adelantos en los mtodos


por distintas personas, se convirti en la primera evidencia deque algunas capacidades humanas podan cuantificarse. El ma-temtico belga Adolphe Quetelet fue el primero en plantear quela teora estadstica de la probabilidad poda aplicarse a la medi-cin del comportamiento humano (Herrera Rojas, 1998).

A estas contribuciones se sumaron las de los primeros estu-diosos de la psicofsica, tales como Gustave Fechner y Ernst We-ber, y los fundadores de la psicologa experimental, destacndo-se la figura de Wilheim Wundt con su fuerte inters por medirla magnitud de propiedades psicolgicas elementales a fin deformular leyes cientficas. Estos autores tambin pusieron demanifiesto la necesidad de controlar las condiciones de prueba ytipificar los procedimientos.

No obstante, el inters de los investigadores pioneros de lamedicin psicolgica se orient principalmente la formulacinde leyes generales que permitiesen predecir el comportamiento,y no tanto hacia la explicacin de las diferencias individuales.

Es de particular relevancia la figura de Sir Francis Galton(1822-1911), primo del clebre Charles Darwin, quien a partirde sus estudios sobre la heredabilidad de la inteligencia, fue elprincipal responsable del inicio del movimiento psicomtrico ydel inters por la medicin de las diferencias individuales. Esteinvestigador ingls, interesado por el estudio de la herencia,cre un laboratorio antropomtrico en Kensington, Inglaterra,donde cualquier persona poda evaluar su estatura, peso corpo-ral, fuerza muscular, agudeza visual y otra serie de caracters-ticas sensoriales y motoras. Galton construy varios tests dediscriminacin sensorial con la conviccin de que stos le permi-tan medir la inteligencia, y fue el primer investigador en adap-tar algunas tcnicas estadsticas para el anlisis de los resulta-dos de los tests, constituyndose en el precursor del uso deprocedimientos de anlisis cuantitativos en investigacin conhumanos (Herrera Rojas, 1998). Con sus estudios sobre gemelosfue tambin uno de los fundadores de la gentica del comporta-miento, uno de los campos ms influyentes en la psicologa con-tempornea (Loelhin, 1992).

En sintona con las ideas de Galton, James Catell construydiferentes tests de tiempos de reaccin y otras funciones menta-les simples. A este autor se le debe, adems, la rpida difusin


tales como la informacin relacionada con la historia clnica, fa-miliar, ocupacional o educacional de una persona.

1.3. Resea histrica

El hecho de que las personas difieran en su comportamiento yque esas diferencias puedan medirse se ha reconocido desde losalbores de la civilizacin. Platn y Aristteles escribieron sobrelas diferencias individuales hace ms de 2000 aos, y los chinos,desde la dinasta Chang (1115 a.C.), ya tenan un programa depruebas para el ingreso de los funcionarios pblicos que evaluabadestrezas importantes para la poca, tales como arquera, equita-cin, msica, escritura y matemtica (Cohen y Swerdlik, 2000).

No obstante, en su acepcin actual, el empleo de los tests psi-colgicos se inici en Europa a fines del siglo XIX. Durante laEdad Media la preocupacin por la individualidad era prctica-mente inexistente, permitindose poca libertad para la expre-sin y el desarrollo de la personalidad (Aiken, 2003). Es en elRenacimiento y la Ilustracin cuando resurge el inters por elaprendizaje y la creatividad.

Sin embargo, recin a finales del siglo XIX se inicia el estudiocientfico de las diferencias individuales en lo que respecta a ha-bilidades y rasgos de personalidad. Los tests se desarrollarondentro del contexto de la formulacin de la teora de la evolu-cin de las especies y las fases tardas de la Revolucin Indus-trial, en el marco de una creciente preocupacin por el aumentode la poblacin, la mano de obra desocupada y la paulatina de-mocratizacin de las escuelas.

En este contexto, surge un llamativo inters por las diferenciasindividuales, especialmente las de carcter hereditario, as comotambin por la adaptabilidad diferencial de los seres humanos alas exigencias de un entorno cambiante. Esta filosofa, denomina-da darwinismo social, centraba su inters en las diferencias denaturaleza hereditaria y la adaptabilidad de los seres humanos alas exigencias de la sociedad industrial (Sternberg, 1987).

Las diferencias observadas por el astrnomo Friedrich Bessela comienzos del siglo XIX en los registros del paso de las estrellasa travs de una lnea del campo visual del telescopio, realizados


En la revisin de la escala Binet-Simon, realizada por Ter-man y conocida como Stanford-Binet, aparece la nocin de Co-ciente Intelectual (CI). La propuesta de Terman del CI comounidad de medida de la inteligencia, con todas sus limitaciones(entre las que se destaca el hecho de que los cocientes intelec-tuales no seran comparables entre edades, debido a diferenciasen la variabilidad de la ejecucin del test), tiene una gran im-portancia en la psicometra, al punto tal que el CI se convirticasi en un mito.

En esta poca tambin fueron muy importantes los descubri-mientos de un grupo de investigadores que perfeccionaron dife-rentes ndices y modelos de anlisis estadsticos, particularmen-te en la medicin de la inteligencia. Se destacaron los trabajos deKarl Pearson (1857-1936), discpulo de Galton, quien desarrollel coeficiente de correlacin que lleva su nombre (producto mo-mento de Pearson), sentando las bases para el anlisis estads-tico que se realiza actualmente en psicologa.

Por otra parte, Charles Spearman (1927) inici una serie deinvestigaciones sobre las funciones cognitivas que lo llevaron aldesarrollo del anlisis factorial. Apoyndose en la observacinde correlaciones entre tests, Spearman plantea su famosa teorade dos factores. Segn esta teora, las puntuaciones de los testspueden explicarse a travs de dos factores: uno general, conoci-do como el factor g, que es comn a todas las variables medidas,y uno especfico, s, que sera exclusivo de cada una de esas va-riables. Pocos acontecimientos en la historia de los tests menta-les han tenido una importancia tan grande como la formulacinde la teora de los dos factores de la inteligencia. Sobre ese fun-damento se han construido numerosos tests, no slo de inteli-gencia sino tambin de personalidad, intereses y otros construc-tos psicolgicos. Spearman concibi tambin la teora de laconfiabilidad de los tests y, junto a Thorndike, el modelo esta-dstico de puntuaciones conocido luego como Teora Clsica delos Tests (Martnez Arias, 1995).

La Primera Guerra Mundial gener grandes problemas parala seleccin y adiestramiento de millones de combatientes. Elprograma de seleccin masiva en el que se involucraron los psi-clogos ms capaces de la poca signific una prueba de la ma-durez de la teora y la tcnica psicomtrica. Se elaboraron los


de los tests en los Estados Unidos y los primeros intentos porvalidarlos en relacin con criterios externos, es decir, comprobarsi efectivamente predecan comportamientos reales diferentesde la situacin de evaluacin, tales como el xito acadmico delos estudiantes universitarios. Sin embargo, su aporte ms sig-nificativo es el de haber introducido en la literatura psicolgicael trmino test mental (Muiz, 2001).

En el ao 1895, el psiclogo francs Alfred Binet public unartculo en el cual criticaba los tests existentes en ese momento,considerando que medan funciones muy elementales y que po-sean escasa capacidad predictiva en relacin con criterios ex-ternos relevantes, tales como el rendimiento acadmico. Binetpropuso crear tests de medicin de funciones mentales mscomplejas, tales como juicio, memoria y razonamiento. Por suparte, Wissler (1901) demostr a comienzos del siglo XX que lostests sensoriales o de reacciones mentales simples no predecanen forma adecuada el rendimiento acadmico de los estudian-tes. Todo esto propici la creacin de medidas psicolgicas mssemejantes a las actividades de la vida cotidiana.

En este contexto se cre la primera escala de inteligencia,que integr las experiencias anteriores e introdujo tems re-lacionados con juicio, comprensin y razonamiento. Binet y Si-mon, a pedido del gobierno francs, utilizaron por primera vezen 1905 una escala para identificar, entre los nios que ingresa-ban a primer grado, aquellos que padecan debilidad mental.Esta escala consista en 30 problemas de dificultad creciente(comprensin verbal y capacidad de razonar con materiales noverbales) y representa el desempeo tpico de los nios a unaedad determinada.

En 1908 estos autores desarrollaron la nocin de edad men-tal y tambin una escala ms refinada que se constituy en elprototipo de los tests individuales de inteligencia. En esta esca-la revisada se aument el nmero de tems y los mismos fueronagrupados sobre la base del rendimiento de una muestra gran-de de nios normales con edades de entre 3 y 13 aos. De estemodo, en el nivel (edad mental) de 3 aos se agruparon todos lostems que resolva el 80% de los nios normales de esa edad yas sucesivamente hasta los 13 aos (Binet y Simon, 1916;Anastasi y Urbina, 1998).


Los investigadores nucleados en la Sociedad Psicomtrica desa-rrollaron una innovacin fundamental: el anlisis factorialmoderno, un mtodo que demostraba con claridad que la inteli-gencia es algo ms que una capacidad unitaria. El psiclogo es-tadounidense Thurstone realiz una serie de aportes a la lgicay los fundamentos matemticos del anlisis factorial, logros quefacilitaron la medicin de aptitudes ms especficas, que contri-buyen al desempeo cognitivo ms all de la influencia de la in-teligencia general o g. El test de Aptitudes Mentales Primariasde Thurstone (1935) fue un modelo para las bateras de testsmultifactoriales posteriores, inaugurando una nueva manera deconcebir y medir la inteligencia.

Como hemos dicho, con el empleo del anlisis factorial seconstruyeron numerosos tests, no slo de inteligencia, sino tam-bin de personalidad, intereses y otros atributos psicolgicos.Teoras contemporneas tales como la de la inteligencia fluida(Gf) y cristalizada (Gc) de Cattell (1967), la teora de los cincofactores de la personalidad (Norman, 1963; Costa y Mc Crae,1999; Goldberg, 1999) y otros modelos semejantes (Caroll, 1993)constituyen un refinamiento de los postulados precursores deSpearman y Thurstone.

La Segunda Guerra Mundial, con sus necesidades de incor-poracin de millones de reclutas, tambin estimul la construc-cin de tests de aptitudes especficas, que fueron muy tiles pa-ra seleccionar pilotos, bombarderos, operadores de radio y otrasfunciones militares especializadas. Por esa poca, Guilford(1967) construy para la fuerza area una batera de tests quemedan diferentes factores de la estructura de la inteligenciahumana. El Test de Aptitudes Diferenciales (Bennet, Seashorey Wesman, 2000), entre otros similares, son herederos de esosdescubrimientos.

La dcada de 1950 es considerada como una fase madurade la teora de los tests, puesto que aparecieron textos que conel tiempo seran clsicos y dejaran establecidos los fundamen-tos tericos de la psicometra. Surge en ese momento histricouna corriente de revisin y anlisis de la fundamentacin cien-tfica de las pruebas. Los trabajos realizados en este perodoversan en su gran mayora sobre teora de la medicin, los prin-cipios y fundamentos de la medicin en psicologa, los proble-


primeros tests colectivos de inteligencia para la clasificacin degrandes masas de reclutas, los clebres tests Alfa y Beta delejrcito norteamericano. El test Army Alfa, elaborado por psic-logos militares dirigidos por Yerkes (1921), estaba constituidopor ocho subtests que medan aspectos tales como razonamien-to prctico, analogas y razonamiento matemtico. El Army Be-ta era una versin no verbal del anterior, utilizada para la eva-luacin de combatientes con capacidades lingsticas limitadaso que no eran angloparlantes.

Woodworth (en Anastasi y Urbina, 1998) desarroll su Perso-nal Data Sheet, un autoinforme con preguntas sobre sintomato-loga mental, tales como usted toma whisky todos los das? (enmi caso debo reconocer que s). La finalidad de este instrumentoera detectar soldados con trastornos psicolgicos y que no fue-ran aptos para el servicio militar durante la Primera GuerraMundial. Este inventario se convirti en modelo para los inven-tarios de personalidad posteriores, ms sofisticados, que revisa-remos ms adelante. La amplia difusin de los tests colectivosdurante la primera conflagracin mundial fue observada con in-ters por los educadores, dada la practicidad de estos instru-mentos. Como consecuencia de todas estas innovaciones se pro-dujo una actividad creciente de construccin de pruebas y sedesarrollaron las nociones iniciales de estandarizacin y valida-cin de los tests mentales.

Es importante destacar en esta poca la obra de Rorschach(1921), el psiquiatra suizo que public una tcnica de psicodiag-nstico basada en una serie de lminas con manchas de tinta,recomendando su uso como herramienta de investigacin. Eltest de Rorschach configur una nueva tendencia en la evalua-cin psicolgica vinculada con modelos tericos psicodinmicos.

El ao 1935 ha sido calificado como bisagra entre el perodohistrico y moderno dentro de la psicometra (Sternberg,1987). Ese ao se fund la Sociedad Psicomtrica por un grupo deinvestigadores agrupados en torno a la figura de L. Thurstone,investigador de la Universidad de Chicago. Tambin en este aosurge la primera publicacin especializada en la medicin psico-lgica, Psychometrika, que contina vigente en la actualidad.

La mayora de los tests publicados hasta ese momento se ba-saban en la concepcin de la inteligencia como rasgo unitario.


a) Bancos de tems: La forma de presentacin ms habitualde un test es un cuadernillo impreso con los tems a resol-ver. Sin embargo, un test bien ajustado para determina-dos propsitos puede ser rpidamente creado a partir deun banco de tems. Una escuela puede solicitar a un editoralgunos tests adecuados a los contenidos de su currcula.En la actualidad es posible elaborar un banco de tems y, apartir del mismo, construir tests con una computadora.Otra posibilidad es generar un nmero ilimitado de for-mas equivalentes de un test, seleccionndolas con el mis-mo criterio de un banco de tems. Un procedimiento deno-minado GAI (generacin automtica de tem) permitegenerar tems mediante determinados algoritmos, que re-quieren programas especficos como el Rasch Item Cali-bration Program (RASCAL, 1989) u otros semejantes. LaTeora de Respuesta al tem, revisada al final de este tex-to, constituye el marco conceptual y metodolgico para eldesarrollo de bancos de tems de tests.

b) Administracin y puntuacin asistida por computadora:Las computadoras son adecuadas para administrar y pun-tuar los tests. Al aplicar una prueba en formato computa-rizado se obtienen mediciones precisas e instantneas, nohay errores en la correccin y se consiguen informes legi-bles con posibilidad de transmisin y multicopias impre-sas. Adems la interaccin con las computadoras fascina alas nuevas generaciones y se espera que esto vaya en au-mento creciente. Un inconveniente es que la informatiza-cin puede ocasionar una prdida de la riqueza de las ob-servaciones no formales que realizan los administradoresexpertos durante la aplicacin de un test individual, algoque puede atenuarse si el administrador acompaa el pro-ceso de respuesta del individuo al test computarizado(Cronbach, 1998).

c) Software de simulacin: Las nuevas tecnologas incremen-tan notablemente la variedad de los estmulos incluidosen los tests. Los simuladores de vuelo, por ejemplo, repre-sentan de modo realista el instrumental que deben mani-pular los pilotos y proporcionan continua retroalimenta-cin de los resultados de sus operaciones. Aunque fueron


mas de validez y confiabilidad y, en sntesis, la construccin deuna teora psicomtrica. As, pueden mencionarse Theory ofMental Tests (Gulliksen, 1950) y las normas tcnicas inicialesde la APA, entre otras obras valiosas (Hogan, 2004).

En la dcada de 1960 se comenz a criticar esta concepcinclsica de la teora de los tests, al tiempo que aparecan teorasalternativas. Hay dos modelos originados en esa poca queprevalecen en la literatura psicomtrica actual: el de maestrade dominio y el de rasgo latente. Dentro del primero se ubicanlos denominados tests con referencia a criterio, trmino intro-ducido por Glaser (1963), que miden un dominio de conoci-miento claramente delimitado. Estos tests estn ntimamenteligados al campo educativo. Por otra parte, la teora de rasgolatente (Rasch, 1963) deriv en la Teora de Respuesta al tem(Lord, 1980), uno de los paradigmas relevantes de la psicome-tra contempornea. Ambos enfoques sern revisados ms ade-lante.

En los ltimos aos del siglo XX se produjo un acercamien-to entre la psicometra y la psicologa cognitiva, y se elabo-raron modelos psicomtricos denominados modelos compo-nenciales que incorporan los diferentes componentes de losprocesos cognitivos en la resolucin de un problema (Van derLinden y Hambleton, 1997; Prieto y Delgado, 1999). Estos mo-delos tambin se conocen como evaluacin inteligente; enellos se presentan tareas que son comunes en la vida real. Unmodelo componencial requiere: a) un anlisis de las operacio-nes mentales (componentes cognitivos) que intervienen en laresolucin de los tems y b) un modelo matemtico que estimela probabilidad de responder correctamente el tem teniendoen cuenta sus propiedades psicomtricas y el nivel de conoci-miento del sujeto.

El uso de las computadoras en psicometra tuvo un notableincremento desde la dcada de 1980, aplicndose en casi todaslas instancias de la evaluacin psicolgica. Debido a su consis-tencia, la computadora lleva al extremo la estandarizacin y ob-jetividad de un test. Algunas de las aplicaciones ms interesan-tes de la informtica en los tests psicolgicos son:


lugar de los tests de lpiz y papel, y c) el diseo de tems msatractivos y realistas, que incorporan recursos audiovisuales yde simulacin computarizada, hecho que promete una nueva ge-neracin de tests de mayor validez (Kaplan y Saccuzzo, 2006;Moreno, Martnez y Muiz, 2004).


diseados para entrenamiento, estos dispositivos puedentambin ser empleados para la evaluacin del progreso enel aprendizaje en cualquier dominio.

La mayora de los tests empleados en las diversas reas de lapsicologa disponen de versiones computarizadas. El directoriode software psicolgico de la APA (1999) describe regularmentecentenares de programas para administrar y/o interpretar testspor computadoras. Estas tecnologas permiten economizar elproceso de puntuacin y elaboracin de perfiles y, al mismotiempo, mejoran la precisin y objetividad de los tests conven-cionales (de lpiz y papel) al eliminar los errores que se cometendurante la puntuacin manual de los mismos.

El alcance de la informtica en psicometra no se limita alempleo de tests asistidos por computadora. En las ltimas dca-das se ha diseado una amplia variedad de programas estads-ticos que incluyen rutinas y menes adecuados para resolverproblemas de investigacin en este dominio (estudios correlacio-nales, anlisis factorial, entre otros). En el apndice de este li-bro presentamos ejemplos de algunos anlisis psicomtricosrealizados con software estadstico moderno.

La bsqueda de informacin relacionada con los tests tam-bin se ve sumamente facilitada por los recursos disponibles enInternet, donde se encuentran bases documentales de granutilidad como la que ofrece el sitio web de la American Psycho-logical Association (www.apa.org), as como revistas y portalescientficos on line (www.sciencedirect.com, por ejemplo), y edito-riales abocadas exclusivamente a la publicacin de tests, talescomo TEA en Espaa (www.teaediciones.com).

En la Facultad de Psicologa de la Universidad Nacional deCrdoba existe una revista electrnica especializada, Evaluar,que peridicamente publica trabajos tericos y empricos rela-cionados con la medicin psicolgica y educativa (www.revistaevaluar.com.ar).

En sntesis, la psicometra moderna evidencia tres caracte-rsticas fundamentales: a) la importancia de la teora de res-puesta al tem en la construccin de tests, coexistiendo con lateora clsica de los tests (y en algunos casos reemplazndola);b) la presencia creciente de los tests basados en computadora en


En la literatura psicomtrica encontramos diversas taxono-mas que utilizan criterios dismiles para clasificar los tests psi-colgicos. As, por ejemplo, stos suelen agruparse en: a) indivi-duales o grupales, segn se administren a una persona por vezo a un grupo de individuos simultneamente; b) de ejecucin, l-piz y papel, visuales, auditivos, o computarizados, de acuerdo alformato y materiales de presentacin de los tests, o c) basadosen la teora clsica o de respuesta al tem, conforme al modeloterico de construccin. Cronbach (1998) distingui entre testsde ejecucin mxima y medidas de ejecucin o respuesta tpica,segn demanden el mayor rendimiento del examinado (comoacontece en los tests de habilidades) en sus respuestas, o midanel comportamiento habitual sin requerir respuestas correctas (ala manera de los inventarios de personalidad, por ejemplo).

Otra clasificacin interesante es la propuesta por Nunnally(1991), en funcin de las reas del contenido (constructos) medi-do por los diferentes tests. Este tipo de taxonoma es particular-mente estimulante para quien se inicia en el estudio de lostests, debido a que aporta una idea general de la diversidad delos campos de aplicacin en los que pueden ser utilizados. Si-guiendo este criterio, Nunnally (1991) discrimin tres catego-ras de tests: de habilidades, de rasgos de personalidad, y depreferencias (intereses, valores y actitudes). No obstante, estaclasificacin es problemtica puesto que las diferencias concep-tuales entre rasgos de personalidad y preferencias no son clarasni aceptadas unnimemente, con constructos (personalidad-in-tereses, intereses-actitudes, intereses-valores, por ejemplo) que

2CLASIFICACIN DE LOS TESTS

Edgardo Prez

nacin gentica o cultural del comportamiento. Para Juan-Espi-nosa (1997), una habilidad desarrollada representa el logro enalgn dominio (por ejemplo, la escritura) y la inteligencia, unacondicin necesaria para ese logro. De acuerdo con este autor, lainteligencia general y las aptitudes especficas (verbal, espacialo matemtica, por ejemplo) dependen de caractersticas ligadasa la constitucin cerebral y de disposiciones genticas de laspersonas, y son ms resistentes al entrenamiento que las varia-bles medidas por los tests de logro o habilidades desarrolladas.No obstante, en algunos tests de inteligencia o aptitudes se in-cluyen tems que parecen medir habilidades desarrolladas msque aptitudes.

La postulacin de un factor cognitivo general (g) que permiteresolver problemas novedosos de cualquier naturaleza se oponea la concepcin de aptitudes relativamente independientes,tambin tradicional en la psicologa. La existencia de un factorgeneral de inteligencia es apoyada por investigaciones psicom-tricas y de la gentica del comportamiento (Plomin, DeFries,McClearn y McGuffin, 2002), pero esto no implica negar la exis-tencia de aptitudes ms especficas. En general se asocia estefactor g a la velocidad de procesamiento cognitivo cuyas basesbiolgicas no estn an bien determinadas, aunque se ha encon-trado alguna evidencia preliminar en relacin con la velocidadde conduccin nerviosa y el nmero de neuronas corticales,entre otros indicadores psicobiolgicos. Se ha definido la inteli-gencia general como flexibilidad comportamental y mental paraencontrar soluciones novedosas a problemas. Claramente, la in-teligencia no es exclusiva de la especie humana aunque el hom-bre sea el mamfero ms inteligente (Roth y Dicke, 2005).

Un test que se considera un indicador adecuado de g es el deMatrices Progresivas de Raven (1993). Se trata de una pruebano verbal, cuyos tems muestran un patrn de relaciones (crucesy crculos, por ejemplo) incompleto, donde los examinados debenresponder seleccionando la secuencia faltante que completa laserie. Si bien sus autores aseguran que este test mide educcinde relaciones, un concepto estrechamente relacionado con la in-teligencia general, diversos anlisis factoriales han cuestionadoesta estructura interna unitaria del test. Se ha afirmado que elRaven, en realidad, mide tres factores cognitivos (percepcin,

CLASIFICACIN DE LOS TESTS 41

se solapan en grado considerable (Anastasi y Urbina, 1998; Ho-lland, 1997). Por otro lado, no existen diferencias formales entrelas escalas que miden actitudes, rasgos de personalidad o inte-reses vocacionales. En efecto, casi todas estas escalas han adop-tado un formato likert de respuesta (Acuerdo-Desacuerdo o Muyseguro-Nada seguro, por ejemplo) que solo vara en el nmerode alternativas contempladas (tres, cinco, siete o diez, entre lasms comunes).

Por estas razones, consideramos que la clasificacin plantea-da por Cronbach (1998) contina siendo la ms adecuada pues-to que se refiere a diferencias esenciales entre los tests inclui-dos en sus dos categoras (ejecucin mxima y respuesta tpica).En este captulo realizaremos algunos agregados a esa clasifica-cin clsica. En efecto, incluimos en nuestra revisin la medi-cin de las creencias de autoeficacia (Bandura, 1987; 1997) y lashabilidades sociales, constructos que hoy no pueden ignorarsedada su importancia conceptual y emprica. Adems, comenta-remos ciertas teoras relevantes en relacin con cada constructoy mencionaremos tests psicolgicos desarrollados internacional-mente y en nuestro mbito en estas dos ltimas dcadas.

2.1. Tests de ejecucin mxima: inteligencia, aptitudes y habilidades

La caracterstica principal de los tests de ejecucin mximaes que demandan a los examinados que respondan de la formams eficiente que puedan frente a tareas problemticas (proble-mas matemticos, por ejemplo) que deben resolver (Cronbach,1998). En estos tests se miden diferencias individuales en el ni-vel de ejecucin mximo ante distintas tareas, cuando se inten-ta realizarlas (Nunnally, 1991). Esto significa que los desempe-os solamente pueden medirse cuando las personas estnmotivadas para realizar una tarea de la mejor manera posible.

Bajo el concepto genrico de tests de ejecucin mxima se in-cluyen variables relacionadas, tales como las aptitudes, las ha-bilidades y la inteligencia. Debe aclararse que la delimitacinde estos conceptos es uno de los problemas ms controvertidosde la psicologa, al igual que el dilema subyacente de la determi-


citamente en la teora CHC es la batera Woodcock-Johnson-III(WJ-III) de aptitudes cognitivas (Woodcock, McGrew y Mather,2001). Las aptitudes medidas por este test son: rapidez en elprocesamiento, procesamiento visual, procesamiento auditivo,memoria, comprensin-conocimiento, razonamiento fluido, lec-tura-escritura y aptitud cuantitativa. Existen versiones de laWJ-III en varios idiomas (incluida una versin en espaol) ycon un rango de aplicacin de 2 a 90 aos. Este test es de admi-nistracin individual y posee buenas propiedades psicomtricasde estandarizacin, confiabilidad y validez.

La teora CHC representa un notable esfuerzo para lograr laconceptualizacin de la inteligencia. Sin embargo, an existendesacuerdos bsicos entre los defensores de esta teora. Porejemplo, algunos investigadores aceptan la existencia de g comoun tercer estrato mientras que otros hablan slo de dos estratos(aptitudes amplias y habilidades especficas). Del mismo modo,no existe consenso respecto de la cantidad de aptitudes del se-gundo estrato.

Recientemente (Johnson y Bouchard, en prensa) se ha pro-puesto otro modelo alternativo de la estructura de la inteligen-cia humana, el VPR (verbal-perceptual-rotacin de imgenes),basado en la teora originalmente formulada por Vernon (1964).La teora VPR propone un factor general de inteligencia, un se-gundo estrato de tres aptitudes generales (verbal, perceptual yde rotacin de imgenes) y un tercer estrato de ocho aptitudesms especficas relacionadas con las anteriores (verbal, acad-mica, fluidez, numrica, memoria, espacial, velocidad percepti-va y rotacin de imgenes). Este modelo se basa en evidenciaspsicomtricas, neurocientficas y provenientes de la gentica delcomportamiento. Estas ltimas indican que un 70% de la varia-bilidad de esta estructura de la inteligencia es explicada porfactores genticos.

En sntesis, la investigacin parece apoyar la existencia deun factor general de inteligencia, que no explica la variabilidadtotal del comportamiento inteligente, y de aptitudes cognitivasque realizan una contribucin especfica al comportamiento in-teligente, ms all de la contribucin de g. Las aptitudes de ma-yor relevancia consensuadas en las diferentes teoras son lasdenominadas verbal y espacial; las dems aptitudes generales y


razonamiento analgico y capacidad espacial) y que deberacomplementarse con una medida del razonamiento verbal paraofrecer un perfil ms completo de la inteligencia en relacin conlas teoras actuales (Hogan, 2004).

Howard Gardner (1994, 1999) efectu una crtica radical almodelo de inteligencia general con su Teora de las InteligenciasMltiples (Multiple Intelligences, MI). Para Gardner, los testsmiden preferentemente aptitudes relacionadas con los requeri-mientos acadmicos de la cultura occidental y por eso slo iden-tifican dos o tres dimensiones (lingstica, espacial y lgico-ma-temtica) de la inteligencia. Su teora, basada primordialmenteen criterios neuropsicolgicos, propone ocho potenciales biopsi-colgicos de procesamiento de informacin (inteligencias) quepermiten resolver problemas o crear productos valorados poruna cultura. Estas inteligencias, segn Gardner (1999), son:Lingstica, Lgico-Matemtica, Espacial, Cinestsico-Corpo-ral, Musical, Interpersonal, Intrapersonal y Naturalista. La teo-ra MI, de fuerte atractivo entre los educadores, constituye unafuente riqusima de hiptesis que no poseen una corroboracinemprica exhaustiva ni tcnicas objetivas de medicin de susconstructos e indicadores (Hood y Johnson, 2002). En efecto, lostests construidos para medir aspectos relacionados con las inte-ligencias mltiples, tales como el Multiple Intelligence Develop-mental Assessment MIDAS (Shearer, 1999) o el Inventario deAutoeficiencia para Inteligencias Mltiples IAMI (Prez, 2001),evalan habilidades autopercibidas o autoeficacia (concepto quetrataremos ms adelante) para actividades relacionadas con lasocho inteligencias.

Tambin existen desarrollos tericos contemporneos que re-presentan una solucin de compromiso entre ambas posturas,admitiendo la existencia del factor g pero tambin de aptitudesy habilidades relativamente independientes. Una de estas teo-ras es la de Cattell-Horn-Carroll (CHC) (Carroll, 1993; Mc-Grew, Flanagan, Keith y Vanderwood, 1997), que propone unmodelo de tres estratos: la inteligencia general en el estrato su-perior (g), un estrato medio de aproximadamente diez aptitudescognitivas (procesamiento visual, por ejemplo) y un estrato infe-rior con numerosas habilidades ms especficas (como las des-trezas manuales). Un instrumento contemporneo basado expl-


2000), compuesto por ocho subtests que permiten obtener pun-tuaciones en competencias requeridas para el xito acadmico uocupacional (aptitud verbal, numrica, espacial, abstracta, me-cnica, administrativa, lenguaje y ortografa).

Se ha criticado a este tipo de tests su falta de poder predicti-vo diferencial puesto que los mejores predictores resultan serlos puntajes combinados de sus subtests verbales y numricos,algo equivalente a un test de inteligencia aunque innecesaria-mente ms extenso, as como la confusin conceptual de incluiraptitudes (como las administrativas) que en realidad son un com-puesto de factores cognitivos y de personalidad (Kline, 2000).No obstante, a los fines de orientacin o seleccin suministraninformacin ms especfica que los tests de inteligencia general,y tal vez en esto radique su popularidad entre los orientadores.El desarrollo de pruebas de aptitudes con bases cientficas sli-das (en especial tests colectivos) es uno de los grandes desafos


especficas asociadas constituyen todava un dominio altamen-te controversial.

La revista Intelligence es una de las publicaciones ms auto-rizadas en relacin con la investigacin y medicin de la inteli-gencia y all regularmente aparecen artculos relacionados conlas diferentes teoras que hemos mencionado.

Las escalas ms utilizadas para la medicin de la inteligen-cia en nuestro medio son las elaboradas por David Wechsler en1939, con varias actualizaciones posteriores; las ltimas refe-rentes al WISC-IV (Wechsler, 2005), para nios y adolescentes,y el WAIS-III (Wechsler, 1999), para adultos. Todas las escalasde Wechsler comprenden subtests verbales y de ejecucin. Lostems de los subtests verbales plantean problemas del tipo Qusignifica arrogante?, o Menciona un planeta de nuestro sistemasolar que no sea la Tierra; los subtests no verbales consisten,por ejemplo, en ensamblar objetos a la manera de un rompeca-bezas.

Anlisis psicomtricos contemporneos de las escalas Wechs-ler identificaron cuatro factores de inteligencia subyacentes (or-ganizacin perceptual, memoria de trabajo, comprensin verbaly velocidad de procesamiento). En la ltima versin del WISC-IV las puntuaciones se interpretan en funcin de esos cuatrofactores y no en la forma tradicional de inteligencia verbal y deejecucin. En las versiones actuales de las escalas Wechsler lostems estn ordenados segn los parmetros de dificultad y dis-criminacin de la teora de respuesta al tem (Hogan, 2004).

La tabla 2.1. presenta un listado de los subtests de estas es-calas y su relacin con los cuatro factores subyacentes a laspuntuaciones.

Las escalas Wechsler son muy empleadas en psicologa clni-ca y educacional y han sido estandarizadas cuidadosamente enlos Estados Unidos y Espaa, entre otros pases, con muestrasnacionales representativas y estratificadas por edad, sexo, raza,educacin y ocupacin.

La orientacin de carrera y la seleccin de personal son reasde trabajo del psiclogo donde resulta de significativa importan-cia la medicin de aptitudes cognitivas. En estos mbitos sonmuy empleadas pruebas multifactoriales como el Test de Apti-tudes Diferenciales (DAT-5) (Bennet, Seashore y Wesman,


Tabla 2.1. Relaciones entre los subtests y los cuatro factores de las escalas Wechsler

Puntuaciones Comprensin Memoria Organizacin Velocidad dede ndice Verbal de Trabajo Perceptual Procesamiento

Subtest verbalesVocabulario xAnalogas xAritmtica xRetencin de Dgitos xInformacin xSucesin de Letras

y Nmeros x

Subtests de ejecucinCompletamiento

de figuras xDgitos y Smbolos Claves xDiseo con Cubos xMatrices xBsqueda de Smbolos x

cimiento en matemtica respecto al rendimiento acadmico. Lostests referidos a criterio (TRC) constituyen un tipo especial detests de rendimiento (en realidad, una forma particular de in-terpretar los resultados de estos tests) que revisaremos en el ca-ptulo de interpretaciones de puntuaciones de tests.

Uno de los desarrollos contemporneos ms relevantes sonlos tests adaptativos o a medida, basados en la teora de res-puesta al tem. En especial los tests de rendimiento educativohan comenzado a adoptar crecientemente esta modalidad. Apartir de un banco de tems, la mayora de los tests adaptativosoperan mediante una estrategia de ramificacin variable parala seleccin progresiva de los tems, que requiere establecer: a)un procedimiento de inicio, a partir del cual se determina el pri-mer tem a presentar, b) un procedimiento para seleccionar, trasuna estimacin provisional del nivel del individuo en el domi-nio, el siguiente tem a presentar, y c) un criterio para dar porfinalizada la prueba (Olea, Ponsoda y Prieto, 1999). En compa-racin con los tests convencionales de longitud fija, mediante unalgoritmo adaptativo se consigue una mejor adecuacin entre ladificultad de los tems y el nivel de rasgo del sujeto, y por tantose obtiene una estimacin precisa de su nivel de rasgo con lapresentacin de pocos tems y en un tiempo de aplicacin re-ducido. Adems, dado que diferentes individuos reciben temsdistintos, los tests a la medida previenen que los tems no seanconocidos antes de su aplicacin. Estos beneficios resultan espe-cialmente importantes para los responsables de programas deevaluacin educativa a gran escala, donde es necesario aplicarlos tests de forma continua a muestras extensas.

Otro mbito relevante para el uso de tests de ejecucin mxi-ma es la neuropsicologa, que estudia las relaciones entre el ce-rebro y la conducta (Kolb y Wishaw, 1986). El desarrollo de laneuropsicologa ha estado determinado por la necesidad de in-vestigar y encontrar herramientas que permitan el diagnsticoy el tratamiento de los dficit en el rendimiento cognitivo (me-moria, lenguaje, atencin, funciones visoespaciales, funcionesejecutivas) despus de producirse una lesin cerebral. Frecuen-temente, estas lesiones resultan en trastornos cognitivos queafectan el desempeo de una persona en las actividades de la vi-da diaria, especialmente en la esfera laboral. Por ello, luego de


del futuro para la orientacin vocacional y la seleccin de perso-nal, dos de las reas ms importantes de la psicologa aplicada(Johnson y Bouchard, en prensa).

En nuestro pas, Cortada de Kohan (1998) elabor el Test deAptitud Verbal Buenos Aires, que consta de 98 tems divididosen dos mitades: sinnimos y definiciones. Todos los tems son deopcin mltiple con 4 alternativas de respuesta, de las cualesuna es la correcta. El tiempo de administracin es libre, perosuelen ser suficientes 25 minutos para terminar la prueba, quepuede ser aplicada tanto en forma individual como colectiva. ElTest Buenos Aires posee baremos para la Argentina, Ecuador,Colombia y Espaa. Se han realizado los estudios psicomtricosclsicos (confiabilidad, validez, anlisis de tems), pero ademsse han obtenido para todos los tems los parmetros de dificul-tad y discriminacin segn la teora de respuesta al tem, algomuy novedoso en nuestro pas. Puede ser utilizado con adoles-centes mayores, desde los 16 aos, y adultos, con al menos tresaos cursados de educacin secundaria. Tambin se dispone deuna versin abreviada que mantiene las propiedades de confia-bilidad y validez de la forma completa y que debe administrar-se con un tiempo lmite de ocho minutos.

Un caso especial son los tests de rendimiento o logro. Estetipo de pruebas se utilizan en todos los niveles del sistema edu-cativo para medir el conocimiento alcanzado en un rea espec-fica. En nuestro medio, Grasso (1969) elabor un test de conoci-miento en matemtica para ingresantes a la universidad. Laprueba est compuesta por 70 problemas (del tipo: Si se lanzantres monedas, cul es la probabilidad de obtener exactamentedos caras?) que el estudiante debe resolver utilizando un forma-to de opcin mltiple de cinco alternativas de respuesta. Laspropiedades psicomtricas del instrumento fueron adecuadas yun anlisis de regresin mltiple permiti constatar que expli-caba un 76% de la varianza del rendimiento acadmico de losestudiantes de primer ao de la Facultad de Matemtica, Astro-noma y Fsica de la Universidad Nacional de Crdoba (prome-dio de calificaciones). Esta contribucin especfica fue muy su-perior a la realizada por las otras variables independientes delmodelo (tests de aptitudes, intereses y valores) que slo incre-mentaron en un 8% la contribucin explicativa del test de cono-


los 2 a los 5 aos). Estas pruebas requieren un buen entrena-miento del evaluador en el manejo, observacin de nios peque-os y tambin slidos conocimientos tericos que permitan otor-gar a las conductas observadas la debida importancia en elcontexto de un diagnstico. Debe destacarse que en ningn casolos tests de desarrollo reemplazan el examen neurolgico del ni-o, sino que lo complementan.

En general, los tests de evaluacin del desarrollo poseen me-nos confiabilidad y validez que otros tests de ejecucin mxima,debido quiz a la pobre capacidad de concentracin de los niospequeos y a la rpida maduracin cognitiva que caracteriza aeste perodo de la vida (Aiken, 2003). No obstante, estos testsson tiles para el diagnstico precoz del retraso mental, lostrastornos cerebrales orgnicos y los trastornos del aprendizaje(por ejemplo, dislexia y discalculia). Entre los principales ins-trumentos que se utilizan en nuestro pas podemos destacar lasescalas de Gesell y Amatruda (1971), construidas para diagnos-ticar si los nios alcanzan parmetros adecuados de desarrollo.A lo largo de un extenso programa de investigacin se obtuvie-ron datos normativos sobre el desarrollo de las habilidades mo-trices, lingsticas y sociales, as como del comportamientoadaptativo, en nios de 0 a 6 aos. Las puntuaciones de estasescalas, determinadas por la presencia o ausencia de conductasespecficas caractersticas a determinada edad, se expresan entrminos de la edad de desarrollo.

Otro instrumento de este tipo, de gran aceptacin internacio-nal, son las Escalas Bayley del Desarrollo Infantil. Las tres es-calas (motora, social y comportamental) se consideran comple-mentarias y suministran una contribucin interesante a laevaluacin clnica del nio (Bayley, 1993).

2.2. Tests de comportamiento tpico: motivacin, actitudes y personalidad

En este tipo de tests ninguna respuesta puede ser calificadacomo correcta o incorrecta. Aqu se evala el comportamientohabitual de los individuos, recurriendo a distintas afirmacionesante las cuales el examinado debe indicar su nivel de acuerdo o


una lesin cerebral es imperioso determinar la cantidad y cali-dad de dao cognitivo que puede haber sufrido la persona.

La evaluacin neuropsicolgica (EN) es la herramienta queposibilita este diagnstico. Lezak (1995) identific cuatro aplica-ciones esenciales de la EN: evaluacin propiamente dicha, cui-dado del paciente y planificacin del tratamiento, rehabilitaciny evaluacin del tratamiento, e investigacin. En el texto clsi-co de Lezak se ha realizado la mayor recopilacin y descripcinde tests neuropsicolgicos existentes, mencionndose ms de500 pruebas de este tipo.

Las reas cognitivas evaluadas por los tests neuropsicolgi-cos son de una enorme variedad. As, podemos citar, entre otras,memoria, atencin, discriminacin visual, gnosias visuales, gno-sias auditivas, discriminacin de color, funciones ejecutivas(planeamiento, verificacin), lenguaje (expresin, comprensin,denominacin), praxias (constructivas, de miembros). Algunosde los tests ms conocidos en este mbito son: el Mini-MentalState Examination (Folstein, Folstein y McHugh, 1975), un testde inspeccin rpida (dura aproximadamente 5 minutos) del es-tado cognitivo general de una persona; el Test de Stroop (1935),una prueba de atencin que requiere determinar el color en elque estn escritos los nombres de colores que se hallan impre-sos en colores incongruentes con la palabra (por ejemplo, la pa-labra rojo escrita en tinta verde); el Test de Clasificacin deCartas de Wisconsin (Heaton, Chelune, Talley, Kay y Curtiss,1991), una prueba de flexibilidad cognitiva; y la Figura Comple-ja, de Rey (1941), un test de memoria visual y praxias construc-tivas. Se ha demostrado acabadamente la importancia, utilidady justificacin de esta rea de evaluacin, cuyo logro ms re-ciente es la posibilidad de identificar precozmente dficit cogni-tivos, tales como la demencia.

Otro dominio ntimamente relacionado con la prevencin eintervencin es el desarrollo infantil. Los tests de evaluacin deldesarrollo infantil miden las reas motora, afectiva, cognitiva ydel lenguaje, facilitando la deteccin precoz de posibles trastor-nos. La poblacin meta de estos instrumentos es la que poseeentre 0 y 5 aos; incluye por lo tanto la evaluacin del neonato(los primeros 30 das de la vida extrauterina); el lactante (desdelos 30 das hasta los 24 meses de edad) y el pre-escolar (desde


Hackett, 1994). La autoeficacia tambin se relaciona con las ap-titudes, puesto que las personas se sienten ms seguras de em-prender aquellas actividades en las que han experimentado xi-to. No obstante, sujetos con igual nivel de habilidad puedenexperimentar diferente seguridad para emprender determina-dos cursos de accin, por lo cual la autoeficacia permite mejorarla prediccin del rendimiento que realizaramos si slo nos gui-ramos por el nivel de habilidad real. Esto es as porque el desa-rrollo de creencias de autoeficacia no slo depende del xito pre-vio sino de otras fuentes, tales como el aprendizaje vicario y lapersuasin social.

La teora social-cognitiva del desarrollo de carrera (Lent,Brown y Hackett, 1994) propone un modelo explicativo de lasinterrelaciones entre rasgos de personalidad, intereses, habili-dades y autoeficacia que contribuye a esclarecer el significadodiferencial de estos constructos.

En la figura 2.1. pueden observarse las relaciones entre ras-gos de personalidad (ms bsicos y ligados a lo gentico) (A), lasaptitudes (tambin hereditarias en gran parte y una de lasfuentes de la autoeficacia al facilitar las experiencias de logroen un dominio) (B), la autoeficacia (ms ligada al aprendizaje,relacionada con el constructo anterior pero tambin influida porexperiencias de aprendizaje adicionales tales como la persua-sin social y el aprendizaje vicario), y los intereses vocacionales(aprendidos en gran medida y relacionados directamente con laautoeficacia y las expectativas de resultados, e indirectamentecon las experiencias de aprendizaje y la personalidad).

Existen algunos interrogantes respecto a la naturaleza de laautoeficacia. En efecto, si bien Bandura (1997) puntualiz cla-ramente que se trata de un constructo aprendido y contextual-mente-especfico, algunos investigadores postulan que tambinexiste un constructo de autoeficacia general, ms semejante alos rasgos de personalidad, y otros han sugerido que la herenciainfluye de manera modesta en la autoeficacia adems del papelinnegable del aprendizaje (Kaplan y Saccuzzo, 2006).

El sitio web del Dr. Frank Pajares (www.emory.edu/EDUCATION/mfp), en la Universidad de Emory, Atlanta, constituye un teso-ro informativo sobre teora, investigacin y medicin de la au-toeficacia. Se han construido escalas de autoeficacia para el


agrado, por ejemplo. Los tests de respuesta tpica comprendenlas medidas de rasgos de personalidad, intereses y actitudes, ascomo de otros constructos afectivos y motivacionales relaciona-dos, como las creencias de autoeficacia (Cronbach, 1998). Lostests de habilidades sociales tambin deben incluirse en esta ca-tegora puesto que su formato habitual de respuesta es el de unautoinforme de respuesta tpica y no el de un test de ejecucinmxima.

Los tests de respuesta tpica son, en su gran mayor,a inven-tarios de autoinforme donde se demanda al individuo informa-cin sobre s mismo. Esta medicin introspectiva y basada exclu-sivamente en el lenguaje genera varias limitaciones importantes,tales como no ser aplicables a nios pequeos y el hecho de quesus respuestas pueden falsearse (de manera intencional o no). Sibien se han ideado procedimientos para atenuar (no eliminar) lasrespuestas negligentes, deshonestas o tendenciosas, los resulta-dos de estos tests deben intepretarse con precaucin y no debe-ran ser nunca el nico criterio utilizado para tomar decisionesclasificatorias o diagnsticas respecto a las personas.

Escalas de autoeficacia

La teora social cognitiva ha destacado el papel de la autoefi-cacia percibida entre las variables motivacionales y afectivas.Bandura (1997) define la autoeficacia como la creencia en laspropias capacidades para realizar determinados cursos de ac-cin. Para este eminente terico, las creencias de las personasacerca de s mismas son elementos clave para la determinacinde su comportamiento, dado que son un elemento de gran in-fluencia y desempean un rol importante en las elecciones efec-tuadas por las personas, el esfuerzo que invierten, la perseve-rancia para alcanzar metas y el grado de ansiedad y confianzaque experimentan frente a las tareas de la vida.

La autoeficacia se relaciona fuertemente con los interesesvocacionales pero se trata de una relacin asimtrica, puestoque, tal como se ha comprobado en numerosas investigaciones,las personas tienden a interesarse por aquellas actividades quese sienten capaces de realizar exitosamente (Lent, Brown y


aprendizaje, la matemtica, la computacin, la escritura, lasconductas de prevencin de enfermedades de transmisin se-xual, el manejo de la tentacin de beber y fumar, la enseanzay el aprendizaje de idiomas, varias de las cuales pueden consul-tarse en la pgina mencionada. Bandura (2001) elabor una mo-nografa para orientar la construccin y anlisis psicomtrico deeste tipo de escalas, la cual es de consulta indispensable parainvestigadores interesados en la medicin de la autoeficacia.

Como ya sealramos, en nuestro medio Prez (2001) cons-truy el Inventario de Autoeficacia para Inteligencias Mltiples(IAMI), con fines de orientacin vocacional, que evala la segu-ridad percibida de los adolescentes para realizar exitosamenteactividades asociadas con las ocho inteligencias mltiples pro-puestas por Gardner (1999). El IAMI incluye 8 escalas obteni-das por anlisis factorial (Lingstica, por ejemplo) y 64 tems(Resolver problemas numricos, por ejemplo). El usuario de laprueba debe responder utilizando un formato de 10 alternati-vas, desde (1) no puedo realizar esa actividad a (10) total-mente seguro de poder realizar exitosamente esa actividad.Este inventario est incluido en un Sistema de Orientacin Vo-cacional Informatizado (Fogliatto y Prez, 2003) y se ha obteni-do evidencia favorable de su confiabilidad y validez, esta ltimarespecto de criterios de rendimiento acadmico y metas de elec-cin de carrera.

Un concepto relacionado con el de autoeficacia es el de au-toestima, o autovaloracin, que la persona realiza acerca de smisma. La autoeficacia es una dimensin especfica y cognitivadel autoconcepto, as como la autoestima es una dimensin glo-bal y valorativa del mismo. En efecto, uno puede valorarse mu-cho a s mismo (autoestima elevada) pero no sentirse capaz derealizar una actividad especfica (autoeficacia disminuida enalgn dominio) y viceversa. En nuestro medio, Grasso (1984)desarroll una escala para medir la autoestima en ancianos.Este instrumento comprende 15 tems cuidadosamente elabo-rados (Ahora ya no sirvo para nada, por ejemplo) que se res-ponden utilizando una escala likert de cuatro posiciones (Muyde acuerdo, De acuerdo, En desacuerdo, Muy en desacuer-do). Una validacin preliminar de la escala demostr que suspuntuaciones permiten discriminar entre una muestra de an-

CLASIFICACIN DE LOS TESTS 5352 INTRODUCCIN A LA PSICOMETRA

(A)

Varia

bles

pers

onale

s (in

puts)

.-P

redis

posic

iones

-Gn

ero

-Raz

a/et

nicida

d-M

inusv

ala/

nivel

de sa

lud

(B)

Apoy

o co

ntex

tual/

Ante

cede

ntes

(Con

textu

al Af

ford

ance

)

Expe

rienc

ias

de

Apre

ndiza

je

Met

as d

e ele

ccin

Accio

nes d

eele

ccin

Logr

os d

e eje

cuci

n y

rend

imien

to

Influ

encia

s con

textu

ales p

rxim

as

al co

mpo

rtam

iento

elec

tivo

Auto

efica

cia

Inte

rese

s

Expe

ctativ

as d

ere

sulta

do

Mod

erad

ores

Fig

ura

2.1

.Mod

elo

soci

al-c

ogn

itiv

o de

des

arro

llo

de c

arre

ra

12

54

6

7

8

9

10

11

3

1 2

ayudan a identificar carreras u ocupaciones donde puede encon-trar satisfaccin.

Debe evitarse la prctica profesional de usar los inventariosde intereses para orientar de manera especfica a los estudian-tes, puesto que stos necesitan considerar, en el proceso de tomade decisiones de carrera, variables igualmente relevantes y,adems, reunir experiencia exploratoria sobre carreras y ocupa-ciones (Hood y Johnson, 2002). En general, se recomienda con-fiar en los resultados de estos instrumentos a partir de los 15-17 aos, aproximadamente, puesto que se ha verificado que laspuntuaciones de los inventarios de intereses son bastante esta-bles a partir de esa edad.

El paradigma ms influyente en el dominio de la medicin delos intereses vocacionales es el formulado por Holland (1997).La teora de Holland es un modelo de congruencia entre los in-tereses y habilidades de una persona, por un lado, y los factoresinherentes a su ambiente, por otro. Segn este modelo terico,existen seis tipos de personalidad: Realista, Investigador, Artis-ta, Social, Emprendedor y Convencional (RIASEC), los que a suvez determinan seis patrones anlogos de intereses y de habili-dades percibidas. El desarrollo de estos tipos depende de unacompleja serie de acontecimientos familiares, orientaciones per-sonales iniciales, preferencias ocupacionales e interacciones concontextos ambientales especficos. Los ambientes en los que vi-ven y trabajan las personas pueden tambin caracterizarse, deacuerdo a su semejanza, con seis modelos que se correspondencon los seis tipos de personalidad anteriormente mencionados.

Los inventarios de intereses vocacionales ms populares sonel Self-Directed Search (Holland, 1994), el Inventario de Strong-Campbell (Campbell y Hansen, 1981) y el Registro de Preferen-cias Kuder (Kuder y Zitowsky (1991). Ms all de sus diferen-cias (Kuder obtuvo sus escalas por anlisis factorial y empleatems de eleccin forzosa, el inventario Strong posee claves ocu-pacionales formadas por la comparacin de personas satisfechasen una ocupacin con respuestas de la muestra de estandariza-cin), todos utilizan el modelo terico RIASEC para interpretarsus resultados, lo cual permite una convergencia conceptual im-pensable en otros dominios de la psicologa. Una iniciativa inte-resante es el Test Visual de Intereses Profesionales (Tetreau y


cianos internados y otra de individuos ms independientes queparticipan en actividades recreativas en un club de adultos ma-yores.

Inventarios de intereses vocacionales

Los intereses vocacionales han sido definidos como perfilesde agrados y aversiones respecto a actividades relacionadas concarreras y ocupaciones (Lent, Brown

Introduccion a La Psicometria

Documents

Transcript of Introduccion a La Psicometria