Fundamentos de Estadística Aplicada: Pruebas Clave y Preparación de Datos
Conceptos Preliminares y Preparación de Datos
Tipos de Variables
- Cuantitativas: Distancia social, homofobias.
- Cualitativas: Sexo, grupo de edad, facultades, nivel de estudios.
Recodificación en Diferentes Variables (RECDF)
Para recodificar una variable en diferentes variables:
- Seleccionar la variable.
- Asegurarse de incluir todos los ítems inversos si aplica.
- Asignar nuevos valores.
- Nombrar la nueva variable (ej.
nombre_variable_R). - Ejecutar el proceso y verificar la ubicación de la nueva variable.
Análisis de Fiabilidad (Alfa de Cronbach)
Para evaluar la consistencia interna de una escala:
- Ir a Analizar > Escala > Análisis de fiabilidad.
- En el recuadro “Elementos”, incluir todos los ítems de la variable.
- En “Estadísticos…”, seleccionar “Escala si se elimina el elemento”.
- Continuar y etiquetar el análisis (ej. FIABILIDAD HOMOFOBIA).
- Aceptar.
Interpretación de la Fiabilidad
Observar la tabla de estadísticas de fiabilidad, específicamente el Alfa de Cronbach:
- Un valor entre 0.71 y 1 (ej. 0.756) indica una fiabilidad significativa y buena consistencia interna.
- Un valor inferior (ej. 0.688) sugiere que la dimensión no tiene una consistencia interna adecuada.
Si la fiabilidad no es adecuada, revisar la última columna de la tabla inferior:
- Si algún valor supera al Alfa de Cronbach inicial: Buscar el valor más alto. Eliminar el ítem correspondiente (X) podría mejorar la fiabilidad.
- Si ningún valor supera al inicial: Aunque la escala no sea fiable, no se puede mejorar eliminando ítems.
Creación de Indicadores (Variables Compuestas)
Para crear una nueva variable que represente una dimensión (ej. media o sumatorio de ítems):
- Ir a Transformar > Calcular variable.
- Asignar un nombre a la nueva variable por dimensión.
- En el cuadro “Expresión numérica”, utilizar funciones como
MEAN()(media) oSUM()(sumatorio) e incluir todos los ítems de la variable separados por comas. - Importante: Si en el análisis de fiabilidad se determinó que la dimensión mejora quitando algún ítem, ese ítem debe ser excluido en este paso.
Pruebas Estadísticas Comunes
Chi-Cuadrado (Relación entre Variables Cualitativas)
Esta prueba evalúa la relación entre dos variables cualitativas.
Procedimiento
- Ir a Analizar > Estadísticos descriptivos > Tablas cruzadas.
- Colocar una variable en “Filas” y la otra en “Columnas”.
- En “Estadísticos…”, seleccionar Chi-cuadrado.
- En “Casillas…”, seleccionar Recuento observado, Recuento esperado y Residuo corregido.
- Ejecutar.
Interpretación
Se generarán tres tablas. Observar la última tabla (Pruebas de Chi-cuadrado):
- Significación (Sig. asintótica – bilateral) de Pearson:
- Si el valor es igual o menor a 0.05, la relación es significativa, lo que indica que existe una relación entre las variables estudiadas.
- Si el valor es mayor a 0.05, no hay una relación significativa.
- Tabla Cruzada (Residuos Corregidos):
- Si los residuos corregidos están entre -1.96 y 1.96, no hay diferencias significativas en esas celdas.
- Si están fuera de este rango, sí existen diferencias significativas.
Explicar cómo la variable dependiente podría estar influida por la independiente, basándose en los resultados.
ANOVA de un Factor (Comparación de Medias: Cualitativa con 2+ Grupos y Cuantitativa)
El ANOVA de un factor se utiliza para comparar las medias de una variable cuantitativa entre dos o más grupos de una variable cualitativa (ej. “Las personas con estudios básicos puntuarán más en homofobia explícita que las de estudios secundarios y superiores”).
Procedimiento
- Ir a Analizar > Comparar medias > ANOVA de un factor.
- En “Lista de dependientes”, colocar la variable cuantitativa (ej. homofobia).
- En “Factor”, colocar la variable cualitativa (ej. ciudades, nivel de estudios).
- En “Opciones…”, seleccionar Descriptivos.
- En “Post-hoc…”, seleccionar DMS y/o Bonferroni (según el tipo de comparación deseada).
- Continuar y pegar.
Interpretación
Observar la segunda tabla (ANOVA):
- Significación (Sig.):
- Si el valor es menor a 0.05, es significativo. Esto indica que el factor (ej. la ciudad) tiene un efecto en la variable dependiente (ej. homofobia), es decir, existen diferencias entre las medias de los grupos, pero no necesariamente entre todos ellos.
Para identificar qué grupos difieren, observar la última tabla (Pruebas Post-Hoc, si se seleccionaron):
- Centrarse en la hipótesis concreta y en el bloque relevante.
- Observar los valores de significación (Sig.) para cada par de grupos. Si son menores a 0.05, hay diferencias significativas entre esos grupos.
Finalmente, revisar las medias en la primera tabla (Descriptivos) para comparar con la hipótesis inicial y determinar si se acepta total o parcialmente, o si se descarta.
Correlación de Pearson (Relación entre Variables Cuantitativas)
Esta prueba evalúa la relación lineal entre dos variables cuantitativas (ej. “A mayor homofobia implícita, mayor distancia social hacia personas gays”).
Procedimiento
- Ir a Analizar > Correlacionar > Bivariadas.
- Seleccionar las dos variables cuantitativas a analizar.
- Pegar y ejecutar.
Interpretación
Observar la tabla de correlaciones:
- Significación (Sig. bilateral):
- Si el valor es menor a 0.05, la correlación es significativa.
- Coeficiente de Correlación de Pearson (r):
- Si el valor es positivo (+), indica una relación positiva: a mayor puntuación en una variable, mayor puntuación en la otra. Cuanto más cerca de 1, más fuerte es la relación.
- Si el valor es negativo (-), indica una relación negativa: a mayor puntuación en una variable, menor puntuación en la otra. Cuanto más cerca de -1, más fuerte es la relación inversa.
Prueba T para Muestras Emparejadas (Comparación de Medias: Dos Cuantitativas Relacionadas)
Esta prueba compara las medias de dos variables cuantitativas relacionadas o medidas en los mismos sujetos (ej. “Una persona puntuará más en sexismo que en homofobia”).
Procedimiento
- Ir a Analizar > Comparar medias > Prueba T para muestras emparejadas.
- Seleccionar las dos variables a comparar.
- Desmarcar la opción “Estimar tamaños del efecto” si no es requerida.
- Pegar y ejecutar.
Interpretación
Se generarán tres tablas. Observar la tercera tabla (Prueba de muestras emparejadas):
- Significación (Sig. bilateral):
- Si el valor es significativo (menor a 0.05), indica que las puntuaciones de las dos variables son estadísticamente distintas.
Para determinar la dirección de la diferencia (cuál puntuó más), revisar las medias en la primera tabla (Estadísticos de muestras emparejadas). Comparar con la hipótesis inicial para aceptar o descartar.
Prueba T para Muestras Independientes (Comparación de Medias: Cualitativa de 2 Grupos y Cuantitativa)
Esta prueba compara las medias de una variable cuantitativa entre dos grupos independientes de una variable cualitativa (ej. “Los hombres puntuarán más en homofobia que las mujeres”).
Procedimiento
- Ir a Analizar > Comparar medias > Prueba T para muestras independientes.
- En “Variable de prueba”, colocar la variable cuantitativa (ej. homofobia).
- En “Variable de agrupación”, colocar la variable cualitativa de dos grupos (ej. sexo).
- Hacer clic en “Definir grupos” y especificar los códigos numéricos de los dos grupos (ej. 1 para hombres, 2 para mujeres).
- Desmarcar la opción “Estimar tamaños del efecto” si no es requerida.
- Pegar y ejecutar.
Interpretación
Se generarán dos tablas. Observar la tabla inferior (Prueba de muestras independientes):
- Prueba de Levene para la igualdad de varianzas (Sig.):
- Si el valor es mayor a 0.05, se asume que las varianzas son iguales, y se debe interpretar la fila superior (“Se asumen varianzas iguales”).
- Si el valor es menor o igual a 0.05, se asume que las varianzas no son iguales, y se debe interpretar la fila inferior (“No se asumen varianzas iguales”).
- Significación (Sig. bilateral) de la Prueba T:
- Una vez seleccionada la fila correcta (según Levene), si el valor de Sig. bilateral es menor a 0.05, indica que existe una diferencia estadísticamente significativa entre las medias de los dos grupos (ej. hombres y mujeres puntúan diferente en homofobia).
Para confirmar la dirección de la diferencia, revisar las medias en la primera tabla (Estadísticos de grupo) y comparar con la hipótesis inicial para confirmar o no.