Un test non paramétrique est un type de test d’hypothèse statistique qui ne suppose pas une distribution normale. Pour cette raison, les tests non paramétriques sont parfois appelés sans distribution. Un test non paramétrique est plus robuste qu’un test standard, nécessite généralement des échantillons plus petits, est moins susceptible d’être affecté par des observations aberrantes et peut être appliqué avec moins d’hypothèses. D’un autre côté, les tests non paramétriques peuvent être moins efficaces que leurs homologues standard, en particulier si la population est réellement distribuée normalement. Les tests non paramétriques sont particulièrement efficaces pour les questions portant sur les fréquences et les proportions.
Le test d’hypothèse standard compare un échantillon d’une population de test à un échantillon d’une population de contrôle pour déterminer si la population de test est statistiquement comparable à la population de contrôle. Si la différence entre le ou les paramètres de l’échantillon — généralement la moyenne et/ou la variance — est suffisamment grande, alors l’échantillon de test peut être jugé distinct de la population témoin. De tels tests paramétriques nécessitent que les paramètres proviennent d’une distribution normale.
Il a été prouvé mathématiquement qu’une taille d’échantillon de 30 ou plus se comportera approximativement comme une distribution normale, de sorte que cette exigence est généralement supposée. Si l’hypothèse n’est pas justifiée, cependant, les résultats des tests pourraient ne pas être valides. Les tests non paramétriques évitent cette hypothèse.
Au lieu de cela, les tests d’hypothèses non paramétriques examinent généralement les données soit en les catégorisant, soit en les ordonnant. Si l’échantillon et les populations témoins sont les mêmes et si les données ont été recueillies correctement, toute différence entre leurs catégories ou leur classement est strictement le fruit du hasard. Si la probabilité que ces différences aient pu se produire par hasard, également appelée valeur P, est inférieure à une probabilité significative choisie, généralement 5 % ou 1 %, alors le testeur rejette l’hypothèse selon laquelle les populations de l’échantillon et du contrôle sont les même et conclut qu’ils sont différents.
Un test non paramétrique courant est un test du Chi carré, utilisé pour comparer les fréquences ou les proportions observées. Lorsqu’un seul ensemble de fréquences est examiné, cela s’appelle souvent un test d’adéquation et est utilisé pour déterminer si les fréquences observées correspondent à la plage attendue. Par exemple, un test d’adéquation pourrait être utilisé pour déterminer si une table de roulette a été truquée en comparant les résultats de la table aux résultats prédits par la théorie des probabilités ou pour déterminer si un médicament contre les maux de tête était efficace en comparant la proportion de personnes dont les maux de tête amélioré sur le médicament à la proportion de personnes dont le mal de tête s’est amélioré lorsqu’ils ont pris un placebo. Si deux fréquences sont examinées, le test non paramétrique du Chi carré peut être utilisé pour tester la corrélation ou l’indépendance entre les facteurs. Les sondeurs politiques recherchent souvent une corrélation entre les facteurs sociaux, économiques ou démographiques et les convictions politiques, par exemple pour voir s’il existe une corrélation entre l’éducation d’une personne et si elle approuve les performances d’un élu.
Un autre test non paramétrique est le test de somme des rangs de Wilcoxon, qui est généralement utilisé dans les mêmes situations que le test d’hypothèse paramétrique standard. Au lieu d’examiner la moyenne de chaque échantillon, cependant, le test de Wilcoxon examine le rang de chaque valeur si les deux échantillons sont classés du plus petit au plus grand. Si les deux échantillons sont les mêmes, chaque groupe doit être réparti uniformément dans le classement. Si un groupe est regroupé à l’extrémité inférieure ou supérieure du classement, cela indique que les deux groupes sont différents.
Par exemple, supposons que quelqu’un veuille déterminer si les films animés sont plus longs ou plus courts que les films non animés. Pour un test standard, il déterminerait la durée moyenne d’un échantillon de films d’animation et d’un échantillon de films d’action réelle et comparerait la différence à la variance des échantillons. Pour le test non paramétrique de Wilcoxon, les temps de film sont classés du moins au plus grand, et les rangs des temps de film d’animation sont additionnés.
La personne pourrait calculer la probabilité que la somme de classement soit de cette taille ou plus petite en déterminant le nombre de classements possibles avec une somme de classement donnée et le nombre total de classements possibles, un calcul qui est simple étant donné la force de calcul de la force brute. Avec deux petits échantillons de six films chacun, il existe déjà 924 arrangements possibles de classements, un nombre qui augmente rapidement beaucoup plus au fur et à mesure que les films sont ajoutés. Alternativement, il existe des tableaux publiés qui donnent des probabilités correspondant à des sommes de rang données pour des tailles d’échantillon données. Ceux-ci peuvent être trouvés dans des textes de statistiques ou en ligne.
Les tests non paramétriques sont un domaine en pleine croissance. Il peut être appliqué dans n’importe quel domaine dans lequel des statistiques plus conventionnelles ont également été utilisées. Les applications sont particulièrement courantes dans les sciences sociales et la médecine, cependant, en particulier lorsque la distribution normale ne peut pas s’appliquer.