¿Qué es una prueba no paramétrica?

Una prueba no paramétrica es un tipo de prueba de hipótesis estadística que no asume una distribución normal. Por esta razón, las pruebas no paramétricas a veces se denominan sin distribución. Una prueba no paramétrica es más robusta que una prueba estándar, generalmente requiere muestras más pequeñas, es menos probable que se vea afectada por observaciones atípicas y se puede aplicar con menos suposiciones. Por otro lado, las pruebas no paramétricas pueden ser menos eficientes que sus contrapartes estándar, particularmente si la población está realmente distribuida normalmente. Las pruebas no paramétricas son particularmente efectivas para preguntas relacionadas con frecuencias y proporciones.

La prueba de hipótesis estándar compara una muestra de una población de prueba con una muestra de una población de control para determinar si la población de prueba es estadísticamente comparable a la población de control. Si la diferencia entre el parámetro o los parámetros de la muestra, por lo general la media y / o la varianza, es lo suficientemente grande, se puede considerar que la muestra de prueba es distinta de la población de control. Dicha prueba paramétrica requiere que los parámetros provengan de una distribución normal.

Se ha demostrado matemáticamente que un tamaño de muestra de 30 o más se comportará aproximadamente como una distribución normal, por lo que generalmente se asume este requisito. Sin embargo, si la suposición no está justificada, es posible que los resultados de la prueba no sean válidos. Las pruebas no paramétricas evitan esta suposición.

En cambio, las pruebas de hipótesis no paramétricas comúnmente examinan los datos, ya sea categorizándolos o ordenándolos. Si la muestra y las poblaciones de control son las mismas y si los datos se recopilaron correctamente, cualquier diferencia entre sus categorías o clasificaciones es estrictamente resultado de la casualidad. Si la probabilidad de que esas diferencias pudieran haber ocurrido por azar, también llamado valor P, es menor que una probabilidad significativa elegida, generalmente 5 por ciento o 1 por ciento, entonces el evaluador rechaza la hipótesis de que la muestra y las poblaciones de control son las mismo y concluye que son diferentes.

Una prueba no paramétrica común es la prueba de chi-cuadrado, que se utiliza para comparar frecuencias o proporciones observadas. Cuando solo se examina un conjunto de frecuencias, a menudo se denomina prueba de bondad de ajuste y se utiliza para determinar si las frecuencias observadas se ajustan al rango esperado. Por ejemplo, se podría usar una prueba de bondad de ajuste para determinar si una mesa de ruleta ha sido manipulada comparando los resultados de la tabla con los resultados que predice la teoría de la probabilidad o para determinar si un medicamento para el dolor de cabeza fue efectivo comparando la proporción de personas con dolor de cabeza. mejoró con el medicamento a la proporción de personas cuyo dolor de cabeza mejoró cuando tomaron un placebo. Si se examinan dos frecuencias, entonces se puede utilizar la prueba no paramétrica de Chi-cuadrado para probar la correlación o independencia entre factores. Los encuestadores políticos a menudo buscan una correlación entre los factores sociales, económicos o demográficos y las creencias políticas, como ver si existe una correlación entre la educación de una persona y si aprueba el desempeño de un funcionario electo.

Otra prueba no paramétrica es la prueba de suma de rangos de Wilcoxon, que generalmente se usa en las mismas situaciones que la prueba de hipótesis paramétrica estándar. Sin embargo, en lugar de examinar la media de cada muestra, la prueba de Wilcoxon examina el rango de cada valor si las dos muestras están ordenadas de menor a mayor. Si las dos muestras son iguales, cada grupo debe distribuirse uniformemente en la clasificación. Si un grupo está agrupado en el extremo inferior o superior de la clasificación, esto indica que los dos grupos son diferentes.
Por ejemplo, suponga que alguien quisiera determinar si las películas animadas son más largas o más cortas que las películas no animadas. Para una prueba estándar, determinaría la duración promedio de una muestra de películas animadas y de una muestra de películas de acción en vivo y compararía la diferencia con la varianza de las muestras. Para la prueba no paramétrica de Wilcoxon, los tiempos de las películas se ordenan de menor a mayor y se suman los rangos de los tiempos de las películas animadas.

La persona podría calcular la probabilidad de que la suma de rangos sea de ese tamaño o menor determinando el número de posibles ordenaciones con una determinada suma de rangos y el número total de posibles ordenaciones, un cálculo que es simple dada la suficiente fuerza de cálculo de fuerza bruta. Con dos pequeñas muestras de seis películas cada una, ya hay 924 posibles arreglos de clasificación, un número que rápidamente crece mucho más a medida que se agregan las películas. Alternativamente, hay tablas publicadas que dan probabilidades correspondientes a sumas de rango dadas para tamaños de muestra dados. Estos se pueden encontrar en textos estadísticos o en línea.
Las pruebas no paramétricas son un campo en crecimiento. También se puede aplicar en cualquier campo en el que se hayan utilizado estadísticas más convencionales. Sin embargo, las aplicaciones son particularmente comunes en las ciencias sociales y la medicina, particularmente cuando no se puede aplicar la distribución normal.