Qu’est-ce que la distribution hypergéométrique?

La distribution hypergéométrique décrit la probabilité de certains événements lorsqu’une séquence d’éléments est tirée d’un ensemble fixe, comme le choix de cartes à jouer dans un jeu. La caractéristique clé des événements suivant la distribution de probabilité hypergéométrique est que les éléments ne sont pas remplacés entre les tirages. Une fois qu’un objet particulier a été choisi, il ne peut plus être choisi. Cette caractéristique est la plus importante lorsque l’on travaille avec de petites populations.

Les auditeurs d’évaluation de la qualité utilisent la distribution hypergéométrique lors de l’analyse du nombre de produits défectueux dans un groupe donné. Les produits sont mis de côté après avoir été testés car il n’y a aucune raison de tester deux fois le même produit. Ainsi, la sélection se fait sans remise.

Les probabilités de poker sont calculées en utilisant la distribution hypergéométrique car les cartes ne sont pas mélangées dans le jeu au cours d’une main donnée. Initialement, par exemple, un quart des cartes d’un jeu standard sont des piques, mais la probabilité de recevoir deux cartes et de les trouver toutes les deux comme des piques n’est pas 1/4 * 1/4 = 1/16. Après avoir reçu le premier pique, il reste moins de pique dans le jeu, donc la probabilité de recevoir un autre pique n’est que de 12/51. Par conséquent, la probabilité de recevoir deux cartes et de les trouver toutes les deux comme des piques est de 1/4 * 12/51 = 1/17.

Les objets ne sont pas remplacés entre les tirages, donc la probabilité de scénarios extrêmes est réduite pour une distribution hypergéométrique. On peut comparer le fait de recevoir des cartes rouges ou noires d’un jeu standard à lancer une pièce. Une pièce équitable atterrira sur face la moitié du temps, et la moitié des cartes d’un jeu standard sont noires. Pourtant, la probabilité d’obtenir cinq cartes consécutives au lancer d’une pièce est plus grande que la probabilité de recevoir une main de cinq cartes et de les trouver toutes comme des cartes noires. La probabilité de cinq faces consécutives est de 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, soit environ 3 pour cent, et la probabilité de cinq cartes noires est de 26/52 * 25/ 51 * 24/50 * 23/49 * 22/48 = 253/9996, soit environ 2.5 pour cent.

L’échantillonnage sans remise réduit la probabilité de cas extrêmes, mais n’affecte pas la moyenne arithmétique de la distribution. Le nombre moyen de faces attendues lorsque l’on lance une pièce cinq fois est de 2.5, ce qui équivaut au nombre moyen de cartes noires attendues dans une main de cinq cartes. Tout comme il est très peu probable que les cinq cartes soient noires, il est également peu probable qu’aucune d’entre elles ne le soit. Ceci est décrit en langage mathématique en disant que le remplacement abaisse la variance sans affecter la valeur attendue d’une distribution.