Qu’est-ce que le degré de liberté ?

Le degré de liberté (df) est un concept le plus utilisé en statistique et en physique. Dans les deux cas, il tend à définir les limites d’un système et la position ou la taille de ce qui est analysé, afin qu’il puisse être représenté visuellement. La définition de df dans les deux domaines est liée, mais pas tout à fait la même.

En physique, le degré de liberté positionne des objets ou des systèmes, et chaque degré fait référence à une position dans le temps, l’espace ou dans d’autres mesures. Df pourrait être utilisé comme synonyme du terme coordonnée, et cela signifie généralement des coordonnées indépendantes du plus petit nombre. Le degré de liberté réel est basé sur le système décrit dans l’espace des phases ou dans tous les types potentiels d’espace qu’un système habite simultanément. Chaque partie de l’espace de phase que le système occupe peut être considérée comme un df, ce qui aide à définir toutes les réalités du système considéré.

D’un point de vue statistique, le degré de liberté définit les distributions de populations ou d’échantillons et se rencontre lorsque les gens commencent à étudier les statistiques inférentielles : tests d’hypothèses et intervalles de confiance. Comme pour la définition scientifique, df dans les statistiques décrit la forme ou les aspects de l’échantillon ou de la population en fonction des données. Toutes les représentations dessinées de distributions n’ont pas de mesure de degré de liberté. La distribution normale standard commune n’est pas définie par des degrés ; au lieu de cela, ce sera la même courbe en forme de cloche dans tous les cas.

Une distribution similaire à la normale standard est student-t. Le Student-t est défini en partie par le degré de liberté dans la formule n-1, où n est la taille de l’échantillon. Cela signifie que si les variables de la distribution devaient être choisies une par une, toutes sauf la dernière pourraient être choisies librement. Il n’y a pas d’autre choix que de prendre la toute dernière et aucune liberté de choisir une autre variable à ce stade. Par conséquent, une variable n’est pas libre ; c’est comme devoir choisir la dernière tuile d’un sac lors d’une partie de Scrabble® où il n’y a pas d’autre choix que de choisir cette lettre.

Différentes distributions comme le F et le chi carré ont des définitions différentes du degré de liberté, et certaines utilisent même plus d’un df dans la définition. Le problème devient confus car la définition df est liée au type de test effectué et n’est pas la même avec les différents tests paramétriques (basés sur des paramètres) et non paramétriques (pas basés sur des paramètres). Essentiellement, ce ne sera pas toujours n-1. Les tests de qualité d’ajustement ou de table de contingence peuvent utiliser la distribution du chi carré avec un df différent de celui qui évalue les tests d’hypothèse à variable unique de la variance ou de l’écart type.

Ce qu’il est important de retenir, c’est que chaque fois qu’un degré de liberté est utilisé pour définir une distribution, il la modifie. Il peut toujours avoir certaines caractéristiques qui ne changent pas, mais la taille et l’apparence varient. Lorsque les gens dessinent des représentations de distributions, en particulier deux des mêmes distributions qui ont un df différent, il leur est conseillé de leur donner une apparence différente pour indiquer que df n’est pas le même.