Che cos’è il test esatto di Fisher?

Il test esatto di Fisher è un test di significatività statistica utilizzato per campioni di piccole dimensioni. È uno dei numerosi test utilizzati per analizzare le tabelle di contingenza, che mostrano l’interazione di due o più variabili. Questo test è stato inventato dallo scienziato inglese Ronald Fisher ed è chiamato esatto perché calcola esattamente la significatività statistica, piuttosto che usando un’approssimazione.

Per capire come funziona il test esatto di Fisher, è essenziale capire che cos’è una tabella di contingenza e come viene utilizzata. Nell’esempio più semplice, ci sono solo due variabili da confrontare in una tabella di contingenza. Di solito, queste sono variabili categoriali. Ad esempio, immagina di condurre uno studio sul fatto che il genere sia correlato al possesso di animali domestici. Ci sono due variabili categoriche in questo studio: genere, maschio o femmina, e proprietà dell’animale domestico.

Viene impostata una tabella di contingenza con una variabile in alto e l’altra a sinistra, in modo che ci sia una casella per ogni combinazione di variabili. I totali sono indicati in basso e all’estrema destra. Ecco come apparirebbe una tabella di contingenza per lo studio di esempio, assumendo un sondaggio di 24 individui:

Proprietario dell’animale domestico
Non un proprietario di animali domestici
Totale
Uomo
1
9
10
Donna
11
3
14
Totale
12
12
24

Il test esatto di Fisher calcola la devianza dall’ipotesi nulla, che sostiene che non ci sono distorsioni nei dati o che le due variabili categoriali non hanno alcuna correlazione tra loro. Nel caso del presente esempio, l’ipotesi nulla è che uomini e donne abbiano la stessa probabilità di possedere animali domestici. Il test esatto di Fisher è stato progettato per le tabelle di contingenza con una piccola dimensione del campione o grandi discrepanze tra i numeri di cella, come quella mostrata sopra. Per le tabelle di contingenza con un campione di grandi dimensioni e numeri ben bilanciati in ogni cella della tabella, il test esatto di Fisher non è accurato ed è preferibile il test chi quadrato.

Nell’analizzare i dati nella tabella sopra, il test esatto di Fisher serve a determinare la probabilità che la proprietà dell’animale domestico sia distribuita in modo non uniforme tra uomini e donne nel campione. Sappiamo che dieci delle 24 persone intervistate possiedono animali domestici e che 12 delle 24 sono femmine. La probabilità che dieci persone scelte a caso dal campione siano composte da nove donne e un uomo suggerirà la significatività statistica della distribuzione dei proprietari di animali domestici nel campione.

La probabilità è indicata dalla lettera p. Il test esatto di Fisher determina il valore p per i dati di cui sopra moltiplicando i fattoriali di ciascun totale marginale – nella tabella sopra, 10, 14, 12 e 12 – e dividendo il risultato per il prodotto dei fattoriali di ciascun numero di cella e del totale complessivo. Un fattoriale è il prodotto di tutti i numeri interi positivi minori o uguali a un dato numero. 10!, pronunciato “dieci fattoriali”, è quindi uguale a 10X9X8X7X6X5X4X3X2X1, ovvero 3,628,800.
Per la tabella sopra, quindi, p= (10!)(14!)(12!)(12!)/(1!)(9!)(11!)(3!)(24!). Usando una calcolatrice, si può determinare che la probabilità di ottenere i numeri nella tabella sopra è inferiore al 2%, ben al di sotto della probabilità, se l’ipotesi nulla è vera. Pertanto, è molto improbabile che non vi sia alcuna contingenza, o relazione significativa, tra genere e proprietà dell’animale domestico nel campione dello studio.