¿Qué es la distribución hipergeométrica?

La distribución hipergeométrica describe la probabilidad de ciertos eventos cuando se extrae una secuencia de elementos de un conjunto fijo, como elegir cartas de un mazo. La característica clave de los eventos que siguen la distribución de probabilidad hipergeométrica es que los elementos no se reemplazan entre sorteos. Una vez que se ha elegido un objeto en particular, no se puede volver a elegir. Esta característica es más significativa cuando se trabaja con poblaciones pequeñas.

Los auditores de evaluación de la calidad utilizan la distribución hipergeométrica cuando analizan la cantidad de productos defectuosos en un grupo determinado. Los productos se apartan después de ser probados porque no hay razón para probar el mismo producto dos veces. Por lo tanto, la selección se realiza sin reemplazo.

Las probabilidades de póquer se calculan utilizando la distribución hipergeométrica porque las cartas no se vuelven a barajar en la baraja dentro de una mano determinada. Inicialmente, por ejemplo, una cuarta parte de las cartas en una baraja estándar son espadas, pero la probabilidad de recibir dos cartas y encontrar que ambas son espadas no es 1/4 * 1/4 = 1/16. Después de recibir la primera espada, quedan menos espadas en la baraja, por lo que la probabilidad de recibir otra espada es de solo 12/51. Por lo tanto, la probabilidad de recibir dos cartas y encontrar que ambas son espadas es 1/4 * 12/51 = 1/17.

Los objetos no se reemplazan entre sorteos, por lo que la probabilidad de escenarios extremos se reduce para una distribución hipergeométrica. Uno puede comparar recibir cartas rojas o negras de un mazo estándar con lanzar una moneda. Una moneda justa aterrizará en «caras» la mitad del tiempo, y la mitad de las cartas en una baraja estándar son negras. Sin embargo, la probabilidad de obtener cinco caras consecutivas al lanzar una moneda es mayor que la probabilidad de recibir una mano de cinco cartas y encontrar que todas son cartas negras. La probabilidad de cinco caras consecutivas es 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, o alrededor del 3 por ciento, y la probabilidad de cinco cartas negras es 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996, o alrededor del 2.5 por ciento.

El muestreo sin reemplazo reduce la probabilidad de casos extremos, pero no afecta la media aritmética de la distribución. El número promedio de caras esperadas cuando uno lanza una moneda cinco veces es 2.5, y esto equivale al número promedio de cartas negras esperadas en una mano de cinco cartas. Así como es muy poco probable que las cinco cartas sean negras, tampoco es probable que ninguna de ellas lo sea. Esto se describe en lenguaje matemático diciendo que el reemplazo reduce la varianza sin afectar el valor esperado de una distribución.