Qu’est-ce que le test exact de Fisher ?

Le test exact de Fisher est un test de signification statistique utilisé pour les petits échantillons. C’est l’un des nombreux tests utilisés pour analyser les tableaux de contingence, qui affichent l’interaction de deux ou plusieurs variables. Ce test a été inventé par le scientifique anglais Ronald Fisher, et il est appelé exact car il calcule exactement la signification statistique, plutôt qu’en utilisant une approximation.

Pour comprendre le fonctionnement du test exact de Fisher, il est essentiel de comprendre ce qu’est un tableau de contingence et comment il est utilisé. Dans l’exemple le plus simple, il n’y a que deux variables à comparer dans un tableau de contingence. Ce sont généralement des variables catégorielles. Par exemple, imaginez que vous meniez une étude pour savoir si le sexe est en corrélation avec le fait de posséder un animal de compagnie. Il y a deux variables catégoriques dans cette étude : le sexe, masculin ou féminin, et la possession d’un animal de compagnie.

Un tableau de contingence est mis en place avec une variable en haut et l’autre à gauche, de sorte qu’il y a une case pour chaque combinaison de variables. Les totaux sont indiqués en bas et à l’extrême droite. Voici à quoi ressemblerait un tableau de contingence pour l’exemple d’étude, en supposant un sondage de 24 personnes :

Propriétaire d’animal domestique
Pas un propriétaire d’animal de compagnie
Total
Homme
1
9
10
Femme
11
3
14
Total
12
12
24

Le test exact de Fisher calcule la déviation à partir de l’hypothèse nulle, qui soutient qu’il n’y a pas de biais dans les données, ou que les deux variables catégorielles n’ont aucune corrélation entre elles. Dans le cas du présent exemple, l’hypothèse nulle est que les hommes et les femmes sont également susceptibles de posséder des animaux de compagnie. Le test exact de Fisher a été conçu pour les tableaux de contingence avec une petite taille d’échantillon ou de grandes divergences entre les numéros de cellules, comme celui illustré ci-dessus. Pour les tableaux de contingence avec une grande taille d’échantillon et des nombres bien équilibrés dans chaque cellule du tableau, le test exact de Fisher n’est pas précis et le test du chi carré est préféré.

En analysant les données du tableau ci-dessus, le test exact de Fisher sert à déterminer la probabilité que la possession d’animaux de compagnie soit inégalement répartie entre les hommes et les femmes de l’échantillon. Nous savons que dix des 24 personnes interrogées possèdent un animal de compagnie et que 12 des 24 sont des femelles. La probabilité que dix personnes choisies au hasard dans l’échantillon soient composées de neuf femmes et d’un homme suggérera la signification statistique de la répartition des propriétaires d’animaux dans l’échantillon.

La probabilité est désignée par la lettre p. Le test exact de Fisher détermine la valeur p pour les données ci-dessus en multipliant les factorielles de chaque total marginal – dans le tableau ci-dessus, 10, 14, 12 et 12 – et en divisant le résultat par le produit des factorielles de chaque numéro de cellule et du total général. Une factorielle est le produit de tous les entiers positifs inférieurs ou égaux à un nombre donné. 10 !, prononcé dix factoriel, est donc égal à 10X9X8X7X6X5X4X3X2X1, soit 3,628,800 XNUMX XNUMX.
Pour le tableau ci-dessus, alors, p= (10!)(14!)(12!)(12!)/(1!)(9!)(11!)(3!)(24!). À l’aide d’une calculatrice, on peut déterminer que la probabilité d’obtenir les nombres du tableau ci-dessus est inférieure à 2 %, bien inférieure au hasard, si l’hypothèse nulle est vraie. Par conséquent, il est très peu probable qu’il n’y ait pas de contingence, ou de relation significative, entre le sexe et la possession d’un animal de compagnie dans l’échantillon de l’étude.