Che cos’è il grado di libertà?

Il grado di libertà (df) è un concetto più utilizzato in statistica e fisica. In entrambi i casi tende a definire i limiti di un sistema e la posizione o dimensione di ciò che viene analizzato, in modo che possa essere rappresentato visivamente. La definizione di df in entrambi i campi è correlata, ma non è esattamente la stessa.

In fisica, il grado di libertà posiziona oggetti o sistemi e ogni grado fa riferimento a una posizione nel tempo, nello spazio o in altre misurazioni. Df potrebbe essere usato come sinonimo del termine coordinata, e di solito significa coordinate indipendenti del minor numero. Il grado di libertà effettivo si basa sul sistema che viene descritto nello spazio delle fasi o in tutti i potenziali tipi di spazio in cui un sistema abita contemporaneamente. Ogni singola parte dello spazio delle fasi che il sistema occupa può essere considerata un df, che aiuta a definire le realtà complete del sistema considerato.

Da un punto di vista statistico, il grado di libertà definisce le distribuzioni di popolazioni o campioni e si incontra quando le persone iniziano a studiare le statistiche inferenziali: verifica delle ipotesi e intervalli di confidenza. Come con la definizione scientifica, df in statistica descrive la forma o gli aspetti del campione o della popolazione a seconda dei dati. Non tutte le rappresentazioni disegnate delle distribuzioni hanno una misurazione del grado di libertà. La distribuzione normale standard comune non è definita per gradi; invece, sarà la stessa curva a campana in tutti i casi.

Una distribuzione simile alla normale standard è student-t. Lo studente-t è definito in parte dal grado di libertà nella formula n-1, dove n è la dimensione del campione. Ciò significa che se le variabili della distribuzione dovevano essere selezionate una per una, tutte tranne l’ultima potevano essere scelte liberamente. Non c’è altra scelta che prendere l’ultima e nessuna libertà di scegliere un’altra variabile a quel punto. Quindi una variabile non è libera; è come dover prendere l’ultima tessera da un sacchetto durante una partita a Scrabble® dove non c’è altra scelta che scegliere quella lettera.

Diverse distribuzioni come la F e il chi-quadrato hanno definizioni diverse di grado di libertà e alcune usano persino più di una df nella definizione. Il problema diventa confuso perché la definizione df è legata al tipo di test eseguito e non è la stessa con i vari test parametrici (basati su parametri) e non parametrici (non basati su parametri). In sostanza, non sarà sempre n-1. Il test della bontà di adattamento o della tabella di contingenza può utilizzare la distribuzione chi-quadrato con df diverso da quello che valuta il test di ipotesi a variabile singola della varianza o della deviazione standard.

Ciò che è importante ricordare è che ogni volta che si usa il grado di libertà per definire una distribuzione, lo cambia. Potrebbe ancora avere alcune caratteristiche che sono immutabili, ma le dimensioni e l’aspetto variano. Quando le persone disegnano rappresentazioni di distribuzioni, in particolare due delle stesse distribuzioni che hanno un df diverso, si consiglia di farle sembrare di dimensioni diverse per trasmettere che df non è lo stesso.