Che cos’è la distribuzione ipergeometrica?

La distribuzione ipergeometrica descrive la probabilità di determinati eventi quando una sequenza di elementi viene estratta da un insieme fisso, come la scelta di carte da gioco da un mazzo. La caratteristica chiave degli eventi che seguono la distribuzione di probabilità ipergeometrica è che gli elementi non vengono sostituiti tra le estrazioni. Dopo che un particolare oggetto è stato scelto, non può essere scelto di nuovo. Questa caratteristica è più significativa quando si lavora con piccole popolazioni.

I revisori della valutazione della qualità utilizzano la distribuzione ipergeometrica quando analizzano il numero di prodotti difettosi in un dato gruppo. I prodotti vengono messi da parte dopo essere stati testati perché non c’è motivo di testare lo stesso prodotto due volte. Pertanto, la selezione viene eseguita senza sostituzione.

Le probabilità del poker sono calcolate utilizzando la distribuzione ipergeometrica perché le carte non vengono rimescolate nel mazzo all’interno di una data mano. Inizialmente, ad esempio, un quarto delle carte in un mazzo standard sono picche, ma la probabilità che vengano distribuite due carte e che siano entrambe picche non è 1/4 * 1/4 = 1/16. Dopo aver ricevuto la prima picche, ci sono meno picche rimaste nel mazzo, quindi la probabilità che ne venga distribuita un’altra è solo 12/51. Quindi, la probabilità di ricevere due carte e di trovarle entrambe picche è 1/4 * 12/51 = 1/17.

Gli oggetti non vengono sostituiti tra le estrazioni, quindi la probabilità di scenari estremi è ridotta per una distribuzione ipergeometrica. Si può paragonare la distribuzione di carte rosse o nere da un mazzo standard al lancio di una moneta. Una moneta equa finirà su “testa” la metà delle volte e metà delle carte in un mazzo standard sono nere. Tuttavia, la probabilità di ottenere cinque teste consecutive quando si lancia una moneta è maggiore della probabilità di ricevere una mano di cinque carte e di trovarle tutte come carte nere. La probabilità di cinque teste consecutive è 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, o circa il 3 percento, e la probabilità di cinque carte nere è 26/52 * 25/ 51 * 24/50 * 23/49 * 22/48 = 253/9996, o circa il 2.5 percento.

Il campionamento senza sostituzione riduce la probabilità di casi estremi, ma non influisce sulla media aritmetica della distribuzione. Il numero medio di teste previsto quando si lancia una moneta cinque volte è 2.5, e questo è uguale al numero medio di carte nere previsto in una mano di cinque carte. Così come è molto improbabile che tutte e cinque le carte siano nere, è altrettanto improbabile che nessuna di esse lo sia. Questo è descritto in linguaggio matematico dicendo che la sostituzione riduce la varianza senza influenzare il valore atteso di una distribuzione.