9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística...

13
Diplomado en Salud Pública 2. Metodología en Salud Pública 09. Inferencia no paramétrica 1 - 13 INFERENCIA NO PARAMÉTRICA Autor: Clara Laguna 9.1 INTRODUCCIÓN Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que permitían encontrar el estadístico correspondiente para obtener un intervalo o para hacer un contraste de hipótesis. Estos procedimientos se conocen como métodos paramétricos y asumen que los datos proceden de una población cuya distribución de probabilidad es conocida (normal), o que al menos la distribución de los estadísticos empleados puede aproximarse mediante el teorema central del límite. Hasta ahora, hemos planteado problemas a partir de poblaciones básicas normales o, en su defecto, a partir de muestras grandes, de varianzas poblacionales iguales, de variables cuantitativas, de muestras independientes, etc. Es muy frecuente, sin embargo, que en el caso de una investigación estadística no se dé alguna de estas condiciones, especialmente cuando los tamaños muestrales son muy reducidos. En tales circunstancias, es posible utilizar métodos alternativos que realizan asunciones mínimas acerca de la distribución de la variable a estudio, y que reciben el nombre de métodos no paramétricos o de distribución libre. Antes de describir de los métodos no paramétricos más utilizados, conviene señalar sus principales ventajas e inconvenientes. Entre las ventajas fundamentales cabe destacar que: Los métodos no paramétricos son muy robustos y, en consecuencia, pueden aplicarse a situaciones donde la utilización de pruebas paramétricas es cuestionable. No utilizan parámetros (no se basa en la media, en la desviación típica, etc.) y, por lo tanto, se pueden emplear sin ninguna condición de aplicación. Así, por ejemplo, la comparación de medias en dos muestras independientes requiere de tamaños muestrales suficientemente grandes para aplicar el teorema central del límite y de una varianza homogénea en ambas poblaciones, mientras que su equivalente no paramétrico permite contrastar globalmente la igualdad de distribuciones bajo la única asunción de que ambas distribuciones sean continuas. La propia naturaleza de las pruebas no paramétricas las hace particularmente útiles para comparar variables cualitativas ordinales, cuyo tratamiento mediante métodos paramétricos clásicos entraña problemas conceptuales ya que estas variables carecen de interpretación numérica

Transcript of 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística...

Page 1: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 1 - 13

INFERENCIA NO PARAMÉTRICA

Autor: Clara Laguna

9.1 INTRODUCCIÓN Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que permitían encontrar el estadístico correspondiente para obtener un intervalo o para hacer un contraste de hipótesis. Estos procedimientos se conocen como métodos paramétricos y asumen que los datos proceden de una población cuya distribución de probabilidad es conocida (normal), o que al menos la distribución de los estadísticos empleados puede aproximarse mediante el teorema central del límite. Hasta ahora, hemos planteado problemas a partir de poblaciones básicas normales o, en su defecto, a partir de muestras grandes, de varianzas poblacionales iguales, de variables cuantitativas, de muestras independientes, etc. Es muy frecuente, sin embargo, que en el caso de una investigación estadística no se dé alguna de estas condiciones, especialmente cuando los tamaños muestrales son muy reducidos. En tales circunstancias, es posible utilizar métodos alternativos que realizan asunciones mínimas acerca de la distribución de la variable a estudio, y que reciben el nombre de métodos no paramétricos o de distribución libre. Antes de describir de los métodos no paramétricos más utilizados, conviene señalar sus principales ventajas e inconvenientes. Entre las ventajas fundamentales cabe destacar que:

Los métodos no paramétricos son muy robustos y, en consecuencia, pueden aplicarse a situaciones donde la utilización de pruebas paramétricas es cuestionable. No utilizan parámetros (no se basa en la media, en la desviación típica, etc.) y, por lo tanto, se pueden emplear sin ninguna condición de aplicación.

Así, por ejemplo, la comparación de medias en dos muestras independientes requiere de tamaños muestrales suficientemente grandes para aplicar el teorema central del límite y de una varianza homogénea en ambas poblaciones, mientras que su equivalente no paramétrico permite contrastar globalmente la igualdad de distribuciones bajo la única asunción de que ambas distribuciones sean continuas.

La propia naturaleza de las pruebas no paramétricas las hace particularmente útiles para comparar variables cualitativas ordinales, cuyo tratamiento mediante métodos paramétricos clásicos entraña problemas conceptuales ya que estas variables carecen de interpretación numérica

Page 2: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 2 - 13

Sin embargo, los métodos no paramétricos presentan una serie de limitaciones que impiden su uso generalizado:

Los métodos no paramétricos se emplean casi exclusivamente para determinar la significación estadística de la comparación entre grupos. No permiten construir intervalos de confianza.

Si se cumplen las condiciones de aplicación de las pruebas paramétricas, el

uso de métodos no paramétricos es un tanto ineficiente, lo que conlleva una leve pérdida de potencia en el análisis.

Estudios de simulación bajo la asunción de normalidad han mostrado una perdida de potencia aproximada del 5% de las pruebas no paramétricas respecto a sus equivalentes paramétricos. Aunque en la actualidad los métodos no paramétricos han experimentado un

fuerte desarrollo, su utilización es aún limitada por la mayor complejidad y menor disponibilidad en los programas de análisis estadístico de uso rutinario.

En general, los métodos no paramétricos se emplean como complemento o alternativa a las pruebas paramétricas cuando no se cumplen las condiciones mínimas para la aplicación de estas últimas. Existen diversos métodos no paramétricos, en este tema nos centraremos en los test análogos a los vistos en el capítulo anterior: el test de la U de Mann-Whitney, el test de Wilcoxon y el test de Kruskal-Wallis.

Figura 9.1 Diagrama de selección de contraste de hipótesis en variables cuantitativas

Page 3: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 3 - 13

9.2 TEST DE LA U DE MANN-WHITNEY

Cuando no se puede usar la t de Student, existe el procedimiento alternativo de la U de Mann-Whitney para comparar las medias de dos grupos independientes. Por tanto, es el análogo no paramétrico de la t de Student para comparación de dos medias independientes. La prueba U de Mann-Whitney permite discutir si hay alguna diferencia entre dos poblaciones de las cuales hemos extraído dos muestras independientes. La prueba U contrasta si las dos muestras son equivalentes en su posición, es decir, si proceden de poblaciones continuas idénticas. La hipótesis alternativa únicamente supone que la tendencia central de una población difiere de la otra, pero no una diferencia de forma o de dispersión. H0: Las poblaciones de las que provienen las muestras están equidistribuidas H1: Las poblaciones no están equidistribuidas El contraste se efectúa combinando las dos muestras y disponiendo el conjunto completo de las observaciones, esto exige una ordenación combinada de las dos muestras con rangos asignados:

Se calcula después la suma de los rangos de las observaciones pertenecientes a la primera muestra y a la segunda, obteniéndose respectivamente R1 y R2, para después calcular los estadísticos.

Se puede demostrar que U1 + U2 = n1 × n2; podemos contrastar la hipótesis H0: no hay diferencia entre poblaciones.

Figura 9.2

Page 4: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 4 - 13

A partir de las tablas estadísticas de la prueba U encontramos los puntos críticos (figura 9.2):

Ejemplo 9.1: Suponemos que dos máquinas trabajan láminas de acero de longitud aleatoria. Queremos determinar si las medidas de las láminas que corta cada máquina son parecidas. Una pequeña muestra de láminas cortadas con cada máquina ha dado los resultados siguientes (en centímetros):

Queremos contrastar, con un 25% de significación, que no existe ninguna diferencia entre las longitudes que proporcionan las dos máquinas. Si combinamos las dos muestras, tendremos la ordenación decreciente siguiente:

con los estadísticos:

donde:

Con una significación α = 0,25, encontramos en las tablas los puntos críticos que permiten contrastar la hipótesis planteada. Éstos son U1 – α/2 = 3 y Uα/2 = 12 y, dado que (2,13) (3,12), no podemos aceptar que las dos máquinas corten láminas de longitud

parecida.

Page 5: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 5 - 13

9.2.1 Test de la U de Mann-Whitney con SPSS Seleccionamos Analizar / Pruebas no paramétricas / 2 muestras independientes:

Nos aparece el siguiente cuadro de dialogo:

En este ejemplo, queremos contrastar si el tiempo de supervivencia en hombres y mujeres tras diagnosticarles un tumor es el mismo. Como vimos en el tema anterior, comprobamos la normalidad de la variable cuantitativa en los dos grupos de la cualitativa. Como p<0,05, no podemos asumir que el tiempo de supervivencia sigue una distribución normal ni en hombres (test K-S) ni en mujeres (como n<50, utilizamos Shapiro-Wilk). Por tanto, utilizaremos la prueba no paramétrica de Mann-Whitney para realizar el test.

Pruebas de normalidad

,138 149 ,000 ,890 149 ,000

,125 46 ,071 ,899 46 ,001

Sexo del paciente

Hombre

Mujer

Tiempo de superv ivencia

en días desde el

momento del diagnóstico

Estadíst ico gl Sig. Estadíst ico gl Sig.

Kolmogorov -Smirnova

Shapiro-Wilk

Corrección de la signif icación de Lillief orsa.

Page 6: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 6 - 13

Realizando la prueba U de Mann-Whitney, obtenemos los siguientes resultados:

Esta primera tabla (Rangos) es descriptiva y en ella se muestran los números de individuos de cada grupo, los rangos medios de cada uno de los dos grupos y las sumas de rangos (R1 y R2). Vemos que el rango promedio de mujeres esta en 104,96 y el de hombres en 95,85.

9.3 TEST DE WILCOXON PARA DATOS EMPAREJADOS En un diseño emparejado o de medidas repetidas cuando los datos a comparar son ordinales o cuantitativos con una muestra pequeña que no sigue una distribución normal, se debe usar el test de Wilcoxon1 para datos emparejados. Para realizar el test dispondríamos de n parejas de valores (xi, yi) que podemos considerar como una variable medida en cada sujeto en dos momentos diferentes.

El test de Wilcoxon calcula las diferencias y su signo, y ordena estas diferencias asignando rangos a cada una de ellas. Los pasos que hay que seguir para su aplicación son los siguientes: En primer lugar, calcularemos el rango para las diferencias en valor absoluto de las parejas de datos; en caso de que haya diferencias nulas, no las tendremos en cuenta

1 “Wilcoxon matched pairs signed rank test” es la mejor prueba no paramétrica para analizar las

diferencias entre parejas de datos. La prueba de Wilcoxon ha inspirado otros test, como el de Mann y Whitney o el de Kruskall y Wallis.

Rangos

149 95,85 14282,00

46 104,96 4828,00

195

Sexo del paciente

Hombre

Mujer

Total

Tiempo de superv ivencia

en días desde el

momento del diagnóstico

N

Rango

promedio

Suma de

rangos

Estadísticos de contrastea

3107,000

14282,000

-,956

,339

U de Mann-Whitney

W de Wilcoxon

Z

Sig. asintót. (bilateral)

Tiempo de

superv ivencia

en días desde

el momento

del

diagnóst ico

Variable de agrupación: Sexo del pacientea.

En la segunda tabla, nos fijamos en la significación estadística. Como p>0.05, no hay diferencias en el tiempo de supervivencia entre hombres y mujeres, por tanto no podemos rechazar la H0. Como éste es un test no paramétrico, no podemos establecer intervalos de

confianza.

Page 7: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 7 - 13

y, en caso de encontrar diferencias idénticas, les asignaremos un rango para su aplicación. A partir de aquí obtendremos la suma T(+) de los rangos de las diferencias positivas y T(−) de las negativas; se puede comprobar que T(+) + T(−) = n(n + 1)/2, donde n equivale al número de parejas de datos para las cuales las diferencias son no nulas. Tras fijar un nivel de significación α y con la ayuda de las tablas de Wilcoxon, encontraremos los puntos críticos T1 − α/2 y T α/2, que nos permitirán contrastar la hipótesis:

H0: no hay diferencia entre las observaciones emparejadas

de acuerdo con el criterio:

Figura 9.3

Ejemplo 9.2: Hemos observado la productividad de once operarios de una fábrica en lunes y en viernes. El total de piezas fabricadas por día y operario es el siguiente:

Page 8: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 8 - 13

Queremos determinar si es posible aceptar la hipótesis de igual productividad por operario en lunes y en viernes, con una significación del 10%. Aplicando el test de Wilcoxon tendremos:

Dado que los puntos críticos son 8 y 37, tendremos que: 7,5 o 37,5 (8,37)

y, en consecuencia, rechazamos la H0.

Page 9: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 9 - 13

9.3.1 Test de Wilcoxon con SPSS En el menú Analizar / Pruebas no paramétricas / 2 muestras relacionadas se indica el par de variables a contrastar y se selecciona el tipo de prueba.

Veamos el siguiente ejemplo: La base de datos gemelos.sav recoge datos sobre actividad deportiva que practicaban en su juventud parejas de gemelos, donde, después de un seguimiento de 20 años, uno de los gemelos ha muerto y el otro sobrevive. Se ha codificado la práctica deportiva según una escala ordinal: 0 a los sedentarios,1 a los que realizaban deporte esporádicamente,2 a los que lo practicaban regularmente y 3 a los que hacían deporte competitivamente y estaban sometidos a entrenamiento.

Una vez hecho el test, SPSS nos ofrece los siguientes resultados: Esta primera tabla (Rangos) es descriptiva y en ella se recoge el número (N) de parejas de observaciones según las diferencias sean positivas, negativas o nulas; los rangos medios (suma rangos/N) correspondientes a cada grupo (negativo, positivo o

nulo) y la suma de rangos de cada tipo T(+) y T(-).

Page 10: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 10 - 13

Por lo tanto, estos datos no proporcionan evidencias que indiquen que la práctica deportiva era superior en los gemelos supervivientes respecto a sus hermanos gemelos fallecidos. El estudio no apoya que la práctica deportiva en la juventud reduzca la mortalidad en el futuro (probablemente le falte potencia por su escaso tamaño muestral).

9.4 TEST DE KRUSKAL-WALLIS El contraste de Kruskall–Wallis es la alternativa no paramétrica del método ANOVA, sirve para contrastar la hipótesis de que k muestras independientes proceden de la misma población o de poblaciones idénticas con la misma mediana. El test de Kruskall–Wallis puede sustituir al ANOVA si:

los datos son ordinales no hay normalidad el tamaño de la muestra es pequeño

Como ocurre con los otros tests, tiene menor potencia y menor sensibilidad para detectar diferencias entre los grupos y no permite construir intervalos de confianza. La hipótesis a contrastar es: H0: Las k muestras provienen de la misma población H1: Alguna proviene de una población con mediana diferente a las demás

Rangos

6a 4,67 28,00

2b 4,00 8,00

1c

9

Rangos negativ os

Rangos posit iv os

Empates

Total

gemelo que muere -

gemelo que sobrevive

N

Rango

promedio

Suma de

rangos

gemelo que muere < gemelo que sobrev ivea.

gemelo que muere > gemelo que sobrev iveb.

gemelo que muere = gemelo que sobrev ivec.

Estadísticos de contrasteb

-1,508a

,132

Z

Sig. asintót. (bilateral)

gemelo que

muere -

gemelo que

sobrev ive

Basado en los rangos positivos.a.

Prueba de los rangos con signo de Wilcoxonb.

En la segunda tabla, se presenta el valor de z y su significación estadística a dos colas, p=0,132 > 0,05. Luego, no se dispone de evidencias para rechazar la hipótesis nula de igualdad en las distribuciones entre el gemelo que sobrevivió y el que murió.

Page 11: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 11 - 13

Supongamos que tenemos k muestras, el número total de elementos en todas las

muestras es: KnnnN ...21

El modo de realizar el contraste es el siguiente:

Se ordenan las observaciones de menor a mayor, asignando a cada una de ellas su rango (1 para la menor, 2 para la siguiente,. . ., N para la mayor).

Para cada una de las muestras, se calcula Ri, como la suma de los rangos de

las observaciones que les corresponden. Si H0 es falsa, cabe esperar que esas cantidades sean muy diferentes.

Se calcula el estadístico:

La regla para decidir si se ha de rechazar o no la hipótesis nula es la siguiente:

Si el número de muestras es k = 3 y el número de observaciones en cada una de ellas no pasa de 5, se rechaza H0 si el valor de H supera el valor teórico que encontramos en la tabla de Kruskall–Wallis.

En cualquier otro caso, se compara el valor de H con el de la tabla de la 2

1k

con k −1 grados de libertad. Se rechaza H0 si el valor del estadístico supera el

valor teórico 2

1;1 k

Ejemplo 9.3: Para comprobar si hay alguna diferencia entre el número de coches aparcados en una calle a diferentes horas del día, hemos hecho observaciones por la mañana (en tres ocasiones), por la tarde (en cinco ocasiones) y por la noche (en cuatro ocasiones). Los resultados que hemos obtenido son los siguientes:

Si utilizamos el test de Kruskal-Wallis con un 5% de significación, averiguaremos si el número de coches aparcados en esta calle no cambia durante el día o, en todo caso, en estas franjas horarias. En primer lugar, asignamos rangos a los valores conjuntos de los tres grupos y los sumamos:

Page 12: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 12 - 13

El estadístico de prueba correspondiente es:

Teniendo en cuenta la primera regla de decisión para rechazar o no la hipótesis nula, H=2,2189, según las tablas estadísticas, es inferior al punto crítico (al 5% de significación), H0,05 = 5,6308, así que no rechazaremos la hipótesis nula. Podemos concluir que no hay diferencias significativas entre el número de coches aparcados por la mañana, por la tarde y por la noche. 9.4.1 El test de Kruskal-Wallis con SPSS Seleccionamos Analizar / Pruebas no paramétricos / k muestras independientes:

En este ejemplo, queremos contrastar si el tiempo de supervivencia en los cuatro grupos según el estado del tumor es el mismo (si las cuatro muestras proceden de poblaciones con la misma mediana).

Page 13: 9. Inferencia no paramétrica - ics-aragon.com · Los métodos de inferencia estadística considerados hasta ahora partían de unos supuestos sobre la población determinados, que

Diplomado en Salud Pública

2. Metodología en Salud Pública

09. Inferencia no paramétrica 13 - 13

Realizando el test de Kruskal-Wallis, obtenemos los siguientes resultados: La primera tabla proporciona los tamaños de muestra y los rangos medios para cada uno de los cuatro grupos. Los rangos medios serían interpretables como un indicador de la magnitud de las diferencias entre los grupos.

Una vez que se rechace la hipótesis nula de igualdad de medianas, como vimos en el ANOVA, se pueden realizar comparaciones a posteriori (dos a dos), pero en el caso de métodos no paramétricos, SPSS no tiene opciones para aplicarlos.

Rangos

9 99,22

26 119,98

93 104,87

67 79,78

195

Estado del tumor2 cm o menos

2-4 cm

> 4 cm

Invasiv o

Total

Tiempo de superv ivencia

en días desde el

momento del diagnóstico

N

Rango

promedio

Estadísticos de contrastea,b

12,311

3

,006

Chi-cuadrado

gl

Sig. asintót.

Tiempo de

superv ivencia

en días desde

el momento

del

diagnóstico

Prueba de Kruskal-Wallisa.

Variable de agrupación: Estado del tumorb.

En la segunda tabla, se presenta el estadístico H, al que SPSS llama chi-cuadrado (12,31), sus grados de libertad son k-1. Su significación estadística es p=0,006 < 0,05. Luego, rechazamos la hipótesis nula de igualdad de medianas. Podemos concluir que las poblaciones comparadas según el estado del tumor difieren en los días de supervivencia de los pacientes.