Psicometría: Fundamentos, Métodos y Aplicaciones en la Medición Psicológica

La psicometría es una disciplina metodológica encargada del desarrollo de teorías, métodos y técnicas que dan apoyo a los procesos de construcción y administración de tests. Su objetivo es proporcionar las garantías científicas necesarias para la medida objetiva y estandarizada de los fenómenos psicológicos no observables a partir de una muestra de comportamientos.

Evolución Histórica de la Psicometría

La psicometría ha evolucionado a través de distintas fases:

  • Primer período: Tests sensoriales y motores.
  • Optimización escolar y endo-construcción.
  • Fase centro-constructiva: Estandarización y especialización.
  • Fase de optimización e internacionalización: Perfeccionamiento.

Escalamiento en Psicometría

El escalamiento es un campo de la psicometría cuyo objetivo es la construcción de instrumentos que permitan llevar a cabo mediciones. Los supuestos básicos son:

  • Existencia de un continuo latente o subyacente a lo largo del cual varían los objetos psicológicos.
  • Los objetos psicológicos pueden situarse de forma ordenada a lo largo de este continuo.

Tipos de Escalamiento

  • Escalamiento psicofísico: Estudia la relación entre los estímulos y las sensaciones.
  • Escalamiento psicológico: Ubica estímulos psicológicos no localizables en una escala física.

Métodos de Escalamiento Psicofísico

Los métodos incluyen:

  • Pregunta (Percepción de estímulos hápticos: detección vs no detección).
  • Observación (Estabilidad en percepción/no percepción).
  • Hipótesis (Umbrales).
Umbrales
  • Umbral Absoluto: Menor cantidad de energía que permite detectar un estímulo.
  • Umbral diferencial: Menor diferencia entre estímulos que una persona es capaz de apreciar.
Ecuación de Weber

El incremento de magnitud que debe experimentar un estímulo para que el sujeto perciba el cambio es una constante de su magnitud inicial.

Método de los Límites
  • Series ascendentes: Se presenta un estímulo por debajo del umbral que nunca produce sensación y se va aumentando gradualmente.
  • Series descendentes: Se presenta un estímulo muy por encima del umbral y se disminuye.

Los puntos de transición se promedian para determinar el umbral absoluto. Para el umbral diferencial, se usan dos pares de estímulos: uno estándar constante y otro de comparación con intensidad variable en series ascendentes y descendentes. El observador indica si el estímulo de comparación es igual, mayor o menor al estándar.

Método de Ajuste

El observador controla la variación en el estímulo. Para el umbral absoluto, ajusta el estímulo disminuyendo o aumentando hasta no detectar. Para el umbral diferencial, ajusta la intensidad del estímulo hasta que iguale al estándar.

Método de Estímulos Constantes

El estímulo presentado a un sujeto no es percibido de la misma forma en todas las ocasiones ni produce la misma sensación.

El umbral absoluto es la magnitud del estímulo percibida por el sujeto en el 50% de las ocasiones. El umbral diferencial se fija con un valor estándar y el sujeto indica si el valor elegido es menor o mayor que el estándar.

Limitaciones de los Métodos Psicofísicos Indirectos

Estos métodos solo proporcionan energía para notar cambios en la respuesta del observador, no una medida de la sensación. Las diferencias apenas perceptibles (DAP) no son iguales, el umbral varía. Los resultados difieren según el método de medida. El umbral se ve afectado por variables externas y no se adapta bien a todos los sistemas sensoriales. Los estímulos de alta o baja intensidad no se ajustan a esta ley.

Diferencias entre la Función Potencial de Stevens y Fechner

Comparación entre las funciones logarítmica y potencial. Dan una escala de respuesta en vez de sensación. Las propiedades del estímulo son determinadas por las instrucciones. Stevens no basa sus mediciones en el umbral, sino en el potencial. Utiliza diferentes métodos de escalamiento.

Métodos de Emparejamiento de Magnitudes

El estímulo es cambiado a voluntad del sujeto.

  • Estimación de magnitudes: Si la magnitud es una escala de números naturales.
  • Producción de magnitudes: El sujeto empareja manipulando el estímulo.
  • Magnitud de modalidad cruzada: Si la magnitud es producida por otro estímulo de distinta modalidad sensorial.

Modelo Escalar de Thurstone

Supuestos básicos:

  • La percepción de los sujetos es variable.
  • Existe un continuo psicológico o subjetivo a lo largo del cual varía el atributo.
  • Cada estímulo origina un proceso discriminante que asigna un valor subjetivo.
  • El valor subjetivo al estímulo varía.
  • La distribución es normal, la media es el valor escalar del estímulo en el continuo psicológico.
  • La desviación típica es la dispersión discriminante y da idea de la ambigüedad suscitada por el estímulo.
  • Cada estímulo dará en un mismo sujeto una distribución discriminante distinta definida por su media y desviación.
  • El modelo se cumple tanto si es un solo sujeto como si es una muestra grande.
Ley de Juicio Categórico

Asume los supuestos generales del modelo lineal general. El continuo psicológico de cada sujeto puede ser dividido en categorías ordenadas. Los sujetos asignarán cada estímulo a una categoría según el atributo que consideren. El juez evalúa si la pregunta es capaz y en qué grado de medirla. Se les pide que emitan juicios de hecho o de valor.

Pioneros de la Psicometría

  • Francis Galton: Clasificó y catalogó las diferentes formas de mentes.
  • James McKeen Catell: Utilizó por primera vez el concepto de Test Mental.
  • 1905 Alfred Binet y Theodore Simon: Crearon la primera prueba de inteligencia.
  • Lewis Madison Terman: Desarrolló la primera escala de puntuaciones referida a las aptitudes mentales.

Medición en Psicología

La concepción clásica del idealismo platónico establece que los actos de medición están restringidos a aquellos que implican la asignación de números. En psicología, es difícil identificar unidades de medida incuestionables y generar mediciones derivadas.

Problemas de la Medición en Psicología

  • Identificar unidades de medida incuestionables o ampliamente aceptadas.
  • Imposibilidad de obtener medidas derivadas.
  • Todo resultado experimental o medida debe ir acompañado del valor estimado del error de la medida.

Teoría Clásica de la Medición de Stevens

Stevens eliminó la restricción de que los números asignados debían obedecer a las leyes de la cantidad. La medición, según Stevens, es la asignación de números a objetos o eventos de acuerdo con reglas predefinidas. Distingue entre tipos de asignaciones:

Escalas de Medida

  • Escala nominal: La asignación de números a un evento u objeto tiene como objetivo identificar inequívocamente ese objeto o evento. La asignación debe seguir la regla uno a uno.
  • Escala ordinal: Establece relaciones de orden. La diferencia numérica entre valores es irrelevante.
  • Escala de intervalo: Proporciona información sobre la distancia entre valores de la escala. El cero es arbitrario. El modelo de asignación de valor es igual al ordinal, pero se puede transformar linealmente.
  • Escala de razón: Incluye la información presente en las escalas anteriores. El valor cero no es arbitrario y no puede contener números negativos.

Problemas de Escalas de Medida y Técnicas Estadísticas

Las inferencias extraídas de las técnicas estadísticas pueden conducir a error si se basan en propiedades del sistema numérico que no están siendo asumidas. La escala no determina qué relaciones empíricas son asumidas por los datos.

Desafíos en la Psicología

La psicología trabaja con constructos. Existe una diferencia entre la investigación preclínica y la humana. En el ámbito clínico, se prefiere lo que funciona frente a lo que está validado.

Cómo Mejorar el Estatus de la Psicología

Es necesario reducir a lo simple, analizar en profundidad y con rigor científico si es posible. Se deben usar modelos clínicos estructurados (no aceptar el todo por el todo). El holismo es más realista.

Componentes de un Test

Un test incluye:

  • Título.
  • Introducción.
  • Instrucciones.
  • Ítems.
  • Ítems complementarios.
  • Datos sociodemográficos.

Método de las Dos Mitades

Mide si los distintos ítems producen resultados similares en el supuesto general. Se aplica un test a una misma muestra en el mismo momento temporal. Se divide el test en dos mitades y se calcula la correlación. Ventajas: se reducen problemas experimentales, no se necesitan más tests o aplicaciones. Desventajas: las mitades deben ser muy similares. Si el test es heterogéneo, las mitades no son comparables. Puede haber cansancio.

Construcción de un Test

La construcción de un test implica:

  • Marco general: Justificación para la creación del instrumento, delimitación de la variable objeto de medición, delimitación del contexto de aplicación (población, circunstancia), propósito para el que se usarán las puntuaciones.
  • Tipos de aproximación:
    • Ideográfica: Para obtener información de un caso específico.
    • Nomotécnica: Para obtener información sobre principios y verdades universales.
  • Delimitar si se está interesado en procesos o resultados.
  • Definición de la variable medida:
    • Semántica: Identificar facetas, dominios o conductas.
    • Sintáctica: Relación que se establece entre ellas y otras variables de interés.
    • Operativa: Búsqueda bibliográfica.
  • Estudios piloto: Parámetros cuantitativos.
    • Índice P: Entre 0 y 1. Si P se asocia al test de ejecución máxima, se usa el índice de dificultad.
    • Índice de dificultad: Entre 0 y 1. Indica la proporción de respuestas correctas.

Modelo Lineal

Asume que la puntuación obtenida en un test o puntuación empírica (X) está formada por la puntuación verdadera (V) y un error no controlable: X = V + E.

Supuestos del Modelo Lineal

  • Primer supuesto: La puntuación verdadera (V) es la esperanza matemática de las infinitas puntuaciones empíricas que una persona puede obtener en ese experimento: Vj = e(Xj).
  • Segundo supuesto: No existe relación entre las puntuaciones verdaderas y las de error: rve = 0.
  • Tercer supuesto: No existe relación entre las puntuaciones de error en dos tests diferentes o entre los errores de medida del mismo test aplicado en dos momentos temporales distintos: re1e2 = 0.

Coeficiente de Fiabilidad

La medida de un test psicométrico se mide a través de la aplicación de dos formas paralelas del mismo test. El índice de fiabilidad es la correlación entre las puntuaciones empíricas y las puntuaciones verdaderas, o también la raíz cuadrada del coeficiente de fiabilidad. El coeficiente de fiabilidad es igual al cuadrado de la correlación entre las puntuaciones observadas y las puntuaciones verdaderas, o al cuadrado del índice de fiabilidad.

Métodos para Calcular la Fiabilidad

  • Método de las formas paralelas: Construir dos formas paralelas de un test (X y X’). Aplicar el test a la misma muestra de sujetos representativa de la población. Calcular el coeficiente de correlación de Pearson en ambas formas. Ventaja: mayor control. Desventaja: la construcción e influencia del primer test.
  • Método test-retest: Aplicación del mismo test en dos ocasiones diferentes a una misma muestra. Calcular el coeficiente de correlación de Pearson. Ventajas: no se necesitan más de dos formas del test. Desventajas: menor control, influencia de la primera aplicación sobre la segunda, intervalo de tiempo y cambios en el grado de cooperación.

Análisis de los Ítems

El análisis de los ítems estudia las propiedades que están directamente relacionadas con las propiedades del test.

Índices Descriptivos

Los índices describen la distribución de las respuestas: medias y variables.

Índices de Discriminación

Describen el grado de relación entre las respuestas a un ítem y algún criterio: índice de dificultad, índice de discriminación e índice de validez.

Wj: Factor de ponderación del ítem. Uij: Respuesta dada por la persona al ítem.

Ítems Dicotómicos

Indica el número de personas que han acertado el ítem.

Índice P

Cuando los ítems son dicotómicos, es la proporción de personas que responden una determinada alternativa. El índice de dificultad es igual a la media del ítem dicotómico. Aj: Aciertos en el ítem. N: Número de personas que han intentado resolverlo. Pj = Aj / N.

Límites del Índice P
  • 0.75 a 0.95: Muy fácil.
  • 0.55 a 0.74: Fácil.
  • 0.45 a 0.54: Normal.
  • 0.35 a 0.44: Difícil.
  • 0.05 a 0.34: Muy difícil.

Un ítem ofrece su máxima información cuando su varianza es máxima, es decir, cuando p = q.

Criterios de Análisis

  • Criterio interno: Análisis de la homogeneidad. Se utiliza para analizar en qué medida cada ítem del test mide el mismo atributo psicológico. Se compara cada ítem con la puntuación total del test.
  • Criterio externo: Análisis de validez. Se analiza en qué medida cada ítem del test predice una variable externa. Se compara cada ítem con la puntuación obtenida en otro test.

Análisis de la Relación entre Predictores y Criterios

  • Un único test predictor y un solo indicador de criterio: Correlación y modelos de regresión lineal simple.
  • Varios predictores y un solo indicador del criterio (batería): Correlación y regresión lineal múltiple.
  • Varios predictores cuantitativos y varios indicadores del criterio cuantitativos: Regresión lineal multivariante y correlación canónica.
  • Procedimientos basados en la utilidad de la decisión: Teoría de utilidad multiatributo.

Validez de los Tests

Se validan las puntuaciones derivadas del test. No es una cuestión de todo o nada, sino de grado. Un solo estudio no es suficiente. La validez es un proceso continuo, no reducido a números, y debe ser revisada periódicamente.

Modelos de la Teoría de la Respuesta al Ítem (TRI)

Modelo Logístico de 2 Parámetros (2-p)

La respuesta a un ítem depende del índice de dificultad (b) y el índice de discriminación (a). La Curva Característica del Ítem (CCI) viene dada por la función logística. Los parámetros a tener en cuenta son a y b. aj: Parámetro de discriminación.

Parámetros

  • Parámetro de dificultad: Proyección del punto de inflexión, donde la probabilidad del ítem es 0.5.
  • Parámetro de discriminación: Proporcional a la pendiente de P(ϴ) cuando ϴ = b. Representa la tasa de cambio en la probabilidad de acertar el ítem en función del nivel de habilidad. La discriminación varía entre 0 y 3.0.

Modelo Logístico de 3 Parámetros (3-p)

Incluye el índice de dificultad (b), el índice de discriminación (a) y la probabilidad de acertar por azar (c).

Parámetros

  • Parámetro de dificultad: Proyección del punto de inflexión de la curva sobre el eje de la habilidad cuando la probabilidad de acertar el ítem es (1+c)/2.
  • Parámetro de discriminación: Proporcional a la pendiente de P(ϴ) cuando ϴ = b.
  • Parámetro de pseudo-azar: Asíntota menor de la CCI, adivinación del ítem.

Validez

La validez hace referencia a la adecuación, significatividad y utilidad. Es un proceso unitario.

Estructura Interna del Test

Un constructo debe ser coherente y riguroso. Se utilizan correlaciones inter-ítems e inter-escalas, análisis factorial exploratorio, análisis factorial confirmatorio y el funcionamiento diferencial de los ítems (DIF).

Validez de Constructo

  • Convergencia y discriminación: Si el constructo es sólido, las mediciones deben converger y ser discriminativas. Se utiliza la matriz multirasgo-multimétodo.
  • Predicción de criterio: Correlación entre el test y el criterio, coeficiente de validez, validez concurrente, validez predictiva y validez retrospectiva.
  • Generalización de la validez: Considera las diferencias en la forma en que se mide el constructo predictor, el tipo de trabajo o currículum implicados, el tipo de medida de criterio utilizada, el tipo de personas evaluadas y el momento temporal del estudio.

Validez Externa

La elección depende del diseño de recogida de datos para la validación y el número de variables implicadas. El objetivo es obtener evidencias del grado de relación entre las puntuaciones obtenidas en un test y una variable o rasgo que se intenta predecir o inferir.

Coeficientes de Validez

El rango de valores del coeficiente de validez es:

  • -1: Relación inversa.
  • 0: Nula.
  • 1: Positiva.

La magnitud de la relación se clasifica como:

  • 0.1 a 0.3: Pequeña.
  • 0.31 a 0.49: Moderada.
  • +0.50: Alta.

Coeficiente de Determinación

Equivale al coeficiente de validez al cuadrado. Representa la varianza común entre el test y el criterio. Si el error típico de estimación es pequeño, el coeficiente de determinación tomará valores próximos a uno. CD = r²xy * 100.

Coeficiente de Alineación

Representa la inseguridad o azar que afecta a los pronósticos. Si la varianza del error es alta, los valores pronosticados de Y’ estarán lejanos de los reales y el coeficiente de alineación tomará valores próximos a uno. Varía entre 0 y 1.

Coeficiente de Valor Predictivo

Representa la proporción de seguridad en los pronósticos. Varía entre 0 y 1. Cuanto mayor sea el coeficiente de alineación, menor será la capacidad del test para pronosticar el criterio.

Análisis Factorial

Utiliza la correlación entre variables para obtener evidencia de la existencia de variables latentes que pueden determinar el comportamiento de los individuos.

Análisis Factorial Confirmatorio

Pone a prueba la hipótesis sobre la estructura y relaciones entre las variables latentes y manifiestas, confiriendo al análisis factorial una nueva dimensión.

Análisis Factorial Exploratorio

Utiliza la matriz de correlaciones entre variables observadas (varianzas-covarianzas) para determinar el número de dimensiones.

Inconvenientes

  • Naturaleza multivariada.
  • Álgebra de matrices.

Prueba de Significación de los Residuales

Tras extraer k factores, se utiliza la prueba de Bartlett. La hipótesis nula establece que todos los eigenvalores son iguales excepto por el error de muestreo. Si la hipótesis se rechaza, se acepta como significativo el primer factor. Este proceso sigue hasta que se encuentra un factor no significativo.

Regla de Kaiser

Se deben seleccionar aquellos eigenvalores cuyo valor sea igual o mayor que 1, ya que con este valor su fiabilidad será positiva. Tiende a ofrecer más factores interpretables de los necesarios.

Scree-Test de Cattell

Representa gráficamente los eigenvalores en el eje de ordenadas y los factores en el eje de abscisas para observar el decrecimiento gráfico de los primeros componentes respecto al resto. El número de factores es la tasa de cambio de los componentes que le siguen.

Matriz Multimétodo-Multirasgo

En esta matriz:

  • Los valores azules representan el coeficiente de fiabilidad.
  • Los valores verdes representan el coeficiente de validez convergente.
  • Los valores rojos representan el coeficiente heterorasgo-mono.
  • La correlación entre diferentes rasgos usando métodos de medida es el coeficiente hetero-hetero.

Validez Convergente

Hace referencia a las correlaciones entre el mismo rasgo medido a través de diferentes métodos. Indica una buena definición de la variable.

Validez Discriminante

Hace referencia a las correlaciones entre diferentes rasgos medidos con el mismo método. Estas deben ser bajas y menores que la fiabilidad y la validez convergente.

Puntuaciones en los Tests

Puntuaciones Basadas en la Norma

Hacen referencia al grupo al que pertenece el sujeto, conociendo su posición en el grupo.

Tipos de Puntuaciones

  • Puntuaciones típicas: Indican el número de desviaciones típicas que un sujeto se aparta de la media. Zx.
  • Puntuaciones típicas derivadas: Transformación de las puntuaciones típicas para evitar signos negativos y números decimales. Tienen medias arbitrarias y obedecen a exigencias prácticas.
  • Percentiles: Porcentaje de sujetos con valores en el rasgo psicológico menores o iguales. No es una escala de unidad constante.
  • Puntuaciones típicas normalizadas: Se calculan los percentiles, se divide entre 100, se busca dicha proporción en la curva y se identifica la puntuación normal.

Puntuación de Dominio

Se basa en la proporción de ítems del dominio evaluado que el sujeto es capaz de responder correctamente.

Puntuación de Criterio

Se basa en la comparación con un criterio definido como un punto de corte en la escala de las puntuaciones del test.

Mapeo de Ítems

Muestra las puntuaciones en el test y los ítems que con mayor probabilidad ilustran mejor el rendimiento que se espera.

Descripción del Nivel de Desempeño

Expertos establecen los niveles de desempeño asociados a determinadas puntuaciones en el test, con el objetivo de informar del nivel de competencia a los interesados. Se indica qué sabe hacer el sujeto que se encuentra en ese rango de puntuaciones.

Puntuación de Corte

  • Métodos empíricos: Es necesario aplicar pruebas y recoger datos del test para establecer la puntuación de corte.
  • Métodos valorativos: Se solicita a un grupo de jueces expertos que evalúen el nivel mínimo de competencia.
  • Métodos mixtos: Utilizan tanto datos valorativos como empíricos para establecer la puntuación de corte.

Moreland identificó 12 competencias mínimas.

Normativa para el Uso de Tests

Se rige por el COP (Colegio Oficial de Psicólogos) e International Test Commission, artículos 40º, 46º y 18.

Índices de Homogeneidad y Correlación

Índice de Homogeneidad D

Divide el grupo en dos subgrupos en función de la media o mediana. El grupo superior está compuesto por puntuaciones superiores a la media, y el grupo inferior por puntuaciones inferiores. Se calcula la proporción de éxito en cada ítem (media) para cada grupo: el superior (Pjs) y el inferior (Pji). El índice varía de -1 a 1. Dj = Pjs – Pji. Los valores se interpretan como:

  • Satisfactorio: +0.4.
  • Requiere revisión: 0.3 a 0.39.
  • Necesita revisión: 0.2 a 0.29.
  • Eliminar: Menos de 0.19.

Coeficiente de Correlación Biserial Puntual

Se aplica la correlación de Pearson cuando el ítem es dicotómico y el test es cuantitativo. uj: Media del test completo acertado. ux: Media de las puntuaciones totales. ox: Desviación típica total. pj: Índice de dificultad del ítem. qj: 1 – pj.

Coeficiente de Correlación Biserial

Es una estimación de la correlación de Pearson cuando el ítem es dicotomizado, subyace una variable continua distribuida de forma normal. Su valor puede ser mayor a 1.

Relación entre Coeficiente de Correlación Biserial-Puntual y Biserial

Se utiliza en el caso de una distribución normal dudosa. y: Ordenada correspondiente a la puntuación típica en la curva.

Coeficiente Phi (ɸ)

Es el coeficiente de correlación de Pearson utilizado si las variables a correlacionar son ambas dicotómicas.

Correlación Tetracórica

Se utiliza si ambas variables a correlacionar están dicotomizadas y se distribuyen normalmente.

Criterio Externo

El índice de homogeneidad D se calcula dividiendo los grupos superior e inferior por la mediana de la puntuación en el criterio externo. Se calcula la proporción de éxito para cada grupo. Varía de -1 a 1.

Teoría de la Respuesta al Ítem (TRI)

La TRI no contradice las asunciones ni las conclusiones fundamentales de la Teoría Clásica de los Tests (TCT), sino que hace asunciones adicionales. Se centra en las propiedades de los ítems en vez de en los tests globales.

Objetivos de la TRI

  • Obtener mediciones que no varíen en función del instrumento utilizado, que sean invariantes.
  • Disponer de instrumentos de medida cuyas propiedades no dependan de los objetos medidos, que sean invariantes respecto de las personas evaluadas.

Postulados Básicos de la TRI

  • Parten de la existencia de rasgos o aptitudes latentes que permiten predecir la conducta ante un ítem.
  • La relación entre el rendimiento o la conducta de un examinado en un ítem y el conjunto de rasgos puede describirse mediante una función monótona creciente.

Características de la Curva Característica del Ítem (CCI)

La función es no lineal, con forma de ojiva en S, lo que expresa que la probabilidad de respuesta correcta es una función monótona creciente de la habilidad.

Elementos Clave

  • La respuesta observable al ítem es función de la habilidad latente, así como de ciertas características de los ítems (parámetros), que especifican la forma concreta de la función.
  • La especificación de la dimensionalidad: Es preciso especificar el o los rasgos que mide un ítem o un test. El vector ϴ puede tener cualquier dimensionalidad, aunque los modelos actuales de mayor uso consideran que el espacio del rasgo es unidimensional.
  • Todo sujeto y todo ítem puede situarse en un punto en el espacio del rasgo o atributo.
  • Las unidades básicas de análisis serán los ítems del test, ya que el test no es más que un conjunto de n ítems.

Ventajas de los Modelos de la TRI

  • Falsabilidad de los modelos: A diferencia de los de la TCT, son falsables. Cuando existe ajuste, se consiguen las dos propiedades de invarianza.
  • Invarianza de los parámetros de los ítems: Son independientes de la muestra particular de sujetos utilizada para su estimación.
  • Invarianza de los parámetros de aptitud: El parámetro ϴ para un sujeto particular es independiente del conjunto concreto de ítems utilizado en su estimación. Existe una relación lineal en los parámetros estimados, lo que permite la comparación inter o intra.
  • Unidimensionalidad del espacio latente: El test es unidimensional, los componentes miden esencialmente un solo rasgo psicológico.
  • Independencia local de ítems: La probabilidad de obtener un patrón de respuestas dado a un test se obtiene como el producto de las probabilidades independientes de responder a cada uno de los ítems.

Modelo Logístico de un Parámetro (1-p)

La respuesta a un ítem solo depende de la competencia de la persona (ϴ) y de la dificultad del ítem. La CCI viene dada por la función logística. Pio: Probabilidad de que el sujeto acierte el ítem. o: Valores de la variable media. bi: Parámetro de dificultad. e: 2.7183.

Características

  • El parámetro de dificultad representa la proyección del punto de inflexión de la curva cuando la probabilidad es 0.5.
  • Media = 0 y Desviación Típica = 1.
  • Valores entre ±3 o ±4.
  • -3: Baja dificultad.
  • +3: Alta dificultad.
  • 0: Dificultad media.