Un test non parametrico è un tipo di test di ipotesi statistica che non presuppone una distribuzione normale. Per questo motivo, i test non parametrici vengono talvolta definiti privi di distribuzione. Un test non parametrico è più robusto di un test standard, generalmente richiede campioni più piccoli, ha meno probabilità di essere influenzato da osservazioni esterne e può essere applicato con meno ipotesi. D’altra parte, i test non parametrici possono essere meno efficienti dei loro omologhi standard, in particolare se la popolazione è realmente distribuita normalmente. I test non parametrici sono particolarmente efficaci per le domande che riguardano frequenze e proporzioni.
Il test di ipotesi standard confronta un campione di una popolazione di test con un campione di una popolazione di controllo per determinare se la popolazione di test è statisticamente comparabile alla popolazione di controllo. Se la differenza tra il parametro oi parametri del campione, solitamente la media e/o la varianza, è sufficientemente ampia, il campione in esame può essere giudicato distinto dalla popolazione di controllo. Tale test parametrico richiede che i parametri provengano da una distribuzione normale.
È stato matematicamente dimostrato che una dimensione del campione di 30 o più si comporterà approssimativamente come una distribuzione normale, quindi questo requisito è generalmente assunto. Se l’ipotesi non è giustificata, tuttavia, i risultati del test potrebbero non essere validi. I test non parametrici evitano questo presupposto.
Invece, il test di ipotesi non parametrico esamina comunemente i dati categorizzandoli o ordinandoli. Se le popolazioni campione e di controllo sono le stesse e se i dati sono stati raccolti correttamente, eventuali differenze tra le loro categorie o classifiche sono strettamente frutto del caso. Se la probabilità che tali differenze possano essersi verificate per caso, chiamato anche valore P, è inferiore a una probabilità significativa scelta, di solito il 5% o l’1%, allora il tester rifiuta l’ipotesi che il campione e le popolazioni di controllo siano stesso e conclude che sono diversi.
Un test non parametrico comune è un test Chi-quadrato, utilizzato per confrontare le frequenze o le proporzioni osservate. Quando viene esaminato un solo set di frequenze, questo è spesso chiamato test di bontà di adattamento e viene utilizzato per determinare se le frequenze osservate rientrano nell’intervallo previsto. Ad esempio, un test di bontà di adattamento potrebbe essere utilizzato per determinare se un tavolo della roulette è stato truccato confrontando i risultati del tavolo con i risultati previsti dalla teoria della probabilità o per determinare se un farmaco contro il mal di testa è efficace confrontando la proporzione di persone il cui mal di testa migliorato con il medicinale alla proporzione di persone il cui mal di testa è migliorato quando hanno assunto un placebo. Se vengono esaminate due frequenze, il test non parametrico Chi-quadrato può essere utilizzato per verificare la correlazione o l’indipendenza tra i fattori. I sondaggisti politici spesso cercano una correlazione tra fattori sociali, economici o demografici e convinzioni politiche, ad esempio per vedere se esiste una correlazione tra l’istruzione di una persona e se approva il comportamento di un funzionario eletto.
Un altro test non parametrico è il test della somma dei ranghi di Wilcoxon, che generalmente viene utilizzato nelle stesse situazioni del test di ipotesi parametrico standard. Invece di esaminare la media di ciascun campione, tuttavia, il test di Wilcoxon esamina il rango di ciascun valore se i due campioni sono ordinati dal minore al maggiore. Se i due campioni sono uguali, ogni gruppo dovrebbe essere distribuito uniformemente nella classifica. Se un gruppo è raggruppato all’estremità inferiore o superiore della classifica, ciò indica che i due gruppi sono diversi.
Ad esempio, supponiamo che qualcuno voglia determinare se i film animati sono più lunghi o più corti dei film non animati. Per un test standard, determina la durata media di un campione di film d’animazione e di un campione di film d’azione e confronta la differenza con la varianza dei campioni. Per il test non parametrico di Wilcoxon, i tempi dei film sono messi in ordine dal minore al più grande e vengono sommati i ranghi dei tempi dei film animati.
La persona potrebbe calcolare la probabilità che la somma dei ranghi sia quella dimensione o inferiore determinando il numero di possibili ordinamenti con una data somma dei ranghi e il numero totale di possibili ordinamenti, un calcolo che è semplice data una forza di calcolo della forza bruta sufficiente. Con due piccoli campioni di sei film ciascuno, ci sono già 924 possibili disposizioni di classifiche, un numero che cresce rapidamente molto più grande man mano che vengono aggiunti i film. In alternativa, esistono tabelle pubblicate che forniscono le probabilità corrispondenti a determinate somme di rango per determinate dimensioni del campione. Questi possono essere trovati nei testi statistici o online.
I test non parametrici sono un campo in crescita. Può essere applicato in qualsiasi campo in cui siano state utilizzate anche statistiche più convenzionali. Tuttavia, le applicazioni sono particolarmente comuni nelle scienze sociali e nella medicina, in particolare quando la distribuzione normale non può essere applicata.