Guía Completa de Pruebas Estadísticas Paramétricas y No Paramétricas

Pruebas Estadísticas

Pruebas Paramétricas (P)

Coeficiente de Pearson

Mide el grado en el que dos variables tienden al cambio al mismo tiempo. No importa cuál es la variable dependiente o independiente, solo mide si existe alguna relación entre ellas y su magnitud.

T de Student

Permite evaluar y observar si existen diferencias significativas entre dos grupos (relacionados o no entre sí) a partir de comparar sus medias en una variable. Existe la versión para datos no relacionados (independientes) y para relacionados (dependientes), sin embargo, es más útil en valores independientes.

ANOVA

Básicamente es una prueba T, pero para comparar y observar diferencias significativas entre 3, 4 o 5 grupos y no 2. Potente herramienta estadística que se basa en el estudio de la variación total entre datos y la descomposición de esta para entender sus razones.

ANOVA Factorial

Un ANOVA factorial es cualquier ANOVA («análisis de varianza») que utiliza dos o más factores independientes y una única variable de respuesta. Este tipo de ANOVA debe usarse siempre que desee comprender cómo dos o más factores afectan una variable de respuesta y si existe o no un efecto de interacción entre los factores sobre la variable de respuesta.

Pruebas No Paramétricas (NP)

Chi Cuadrada

Evalúa hipótesis de la relación entre 2 variables categóricas. Compara frecuencias esperadas (según datos poblacionales) con las frecuencias obtenidas a partir de una muestra para ver si existen diferencias significativas. Prácticamente una prueba T de un grupo. Evalúa diferencias entre dos grupos, pero no relacionados (hombres y mujeres, gatos y perros, vivos y fallecidos).

McNemar

Compara el cambio en la distribución de proporciones entre dos mediciones de una variable dicotómica y determinar que la diferencia no se deba al azar (que las diferencia sea estadísticamente significativa).

U de Mann Whitney

Contrasta datos que previamente fueron organizados y ordenados en rangos, básicamente requiere de orden para poder ser aplicada. Realmente es una alternativa para cuando no se puede usar la prueba T de Student:

El tamaño muestral de algunos de los grupos es menor de 30 y la distribución de los datos no puede aproximarse a la distribución normal.
Cuando la variable independiente es ordinal.
Si la muestra es muy pequeña (≤10)

Kruskall Wallis

Es exactamente una prueba U, pero para comparar más de 2 grupos (representados por K) independientes. Los grupos por comparar no es necesario que lleven una distribución normal ni que sean homogéneos en cuanto a sus varianzas. Es la variación no paramétrica de ANOVA.

Conceptos Clave

Hipótesis

Es una idea, una suposición que basamos en una información previa y que permite explicar el por qué de algo o la relación entre diferentes hechos. Explicaciones tentativas del fenómeno investigado que se enuncian como proposiciones o afirmaciones.

Hipótesis Nula

Constituyen proposiciones acerca de la relación entre variables, sólo que sirven para refutar o negar lo que afirma la hipótesis de investigación.

Hipótesis Alternativa

Son posibilidades alternas de las hipótesis.

Nivel de Significancia

Nivel de la probabilidad de equivocarse y que fija de manera a priori el investigador.

Error Tipo I

Es el nivel de significancia, denotado por la letra griega “α”, se define como la probabilidad de “rechazar” la H₀ cuando esta es verdadera.

Error Tipo II

Es el valor predictivo, denotado por la letra griega “β”, se define como probabilidad de “aceptar” la H₀ cuando ésta es falsa. El procedimiento busca fijar la probabilidad de cometer error Tipo I, α, y minimizar la probabilidad de cometer error Tipo II, β.

Valor de P

Probabilidad de que un valor estadístico calculado sea posible dada una hipótesis nula cierta. (se usa para indicar si un resultado observado se puede deber o no a la casualidad.

Intervalo de Confianza

Niveles de probabilidad de cometer un error, o de equivocarse en la prueba de hipótesis o la estimación de parámetros. Los niveles más comunes son 0.05 y 0.01.

Criterios para usar una prueba paramétrica

Mayor potencia estadística
Se aplican en valores ordinales o de intervalo
Se utilizan para muestras grandes
Su distribución de datos es normal
Hace muchas suposiciones
Exigen mayor condición de validez
Menor probabilidad de errores

Criterios para usar una prueba no paramétrica

Menor potencia estadística
Aplican variables categóricas
Se usan muestras pequeñas
No se conoce la forma de distribución de datos
No hacen muchas suposiciones
Exigen menor condición de validez
Mayor probabilidad de errores

Ejercicios

Indica cuál de las siguientes afirmaciones es verdadera:
1. La estadística estudia y ofrece métodos para valorar la validez externa de los estudios.
2. La epidemiología estudia y ofrece métodos para valorar la validez interna de los estudios.
3. Para valorar la validez externa de un estudio debe aplicarse el conocimiento biológico sobre el objeto y las asociaciones de estudio y, por tanto, no siempre la ausencia de representatividad implica la ausencia de validez externa.
4. Todas las afirmaciones anteriores son verdaderas.
Indica cuál de las siguientes afirmaciones sobre la aleatorización (randomization) es falsa:
1. Implica que se distribuye la muestra del estudio al azar en dos o más grupos.
2. Tras una aleatorización simple 1:1, los grupos presentarán un número exactamente similar de sujetos.
3. La aleatorización de 100 sujetos en cinco grupos (placebo y cinco dosis diferentes) en un ensayo clínico garantiza que los grupos sean similares y, por tanto, los sujetos en cada uno de los grupos únicamente se diferenciarán en la intervención aplicada.
4. Es equivalente a la selección aleatoria de una muestra
En relación con los intervalos de confianza, indica cuál de las siguientes afirmaciones es falsa:
1. El intervalo de confianza contiene una serie de valores que se confía en que contengan el verdadero parámetro poblacional.
2. Para calcular el intervalo de confianza es preciso calcular en la muestra el estimador apropiado y el error estándar.
3. El error estándar empleado para calcular intervalos de confianza y contrastes de intervalos de confianza y contrastes de hipótesis es un indicador de la variabilidad de los individuos.
4. Un intervalo de confianza al 95% se suele obtener al restar y sumar el error estándar multiplicado por 1,96.
Se está estudiando si los traumatismos craneales incrementan el riesgo de desarrollar demencia. ¿Cuál de las siguientes afirmaciones es falsa?
1. La hipótesis nula (H₀) es que los traumatismos craneales no incrementan el riesgo de presentar demencia.
2. Un error tipo 2 consiste en concluir que los traumatismos craneales no incrementan el riesgo de demencia cuando fuese cierto que sí lo incrementan, y su probabilidad equivale a la potencia.
3. La hipótesis alternativa (H₁) es que los traumatismos craneales incrementan el riesgo de presentar demencia.
4. Un error tipo 1 consiste en concluir que los traumatismos craneales incrementan el riesgo de demencia cuando esto fuese falso y su probabilidad equivale a α.
Indica cuál de las siguientes afirmaciones es verdadera al valorar los resultados de un un estudio:
1. Se rechaza la hipótesis nula y se acepta la hipótesis alternativa cuando el valor p obtenido es inferior a α, independientemente del número de comparaciones.
2. En general, está indicado realizar test estadísticos a una cola.
3. El intervalo de confianza ofrece información sobre la significación estadística y la potencia estadística del estudio.
4. Al aumentar la confianza, se estrechará un intervalo de confianza.
Sobre el valor p, cuál de las siguientes afirmaciones es falsa.
1. El valor p depende del tamaño de la muestra.
2. El valor p depende de la magnitud del efecto.
3. El valor p no indica si los resultados son clínicamente significativos.
4. El valor p indica la probabilidad de que la hipótesis nula sea falsa.