Qu’est-ce que l’hétéroscédasticité?

L’hétéroscédasticité est un terme statistique utilisé pour décrire le comportement de la variance et de l’écart type d’un échantillon. Si la qualité est présente, alors la variance et l’écart type de la variable ne sont pas constants sur l’ensemble du graphique des données de l’échantillon. Si ces mesures sont constantes, alors les données sont dites homoscédastiques.

La variance d’une variable est une mesure de la distance entre les valeurs observées et la valeur moyenne. L’écart type est la racine carrée de la variance, et il est souvent utilisé pour décrire les distributions. Selon la relation décrite par le théorème de Chebyshev, un certain pourcentage de données doit se situer dans chaque écart type de la valeur moyenne. Par exemple, au moins 75 % des points de données dans un échantillon doivent être à moins de deux écarts types de la moyenne. Ainsi, l’écart type d’un échantillon donne des informations approximatives sur la position relative de chaque point de données.

Il existe deux variétés d’hétéroscédasticité: conditionnelle et inconditionnelle. Si les données sont conditionnellement hétéroscédastiques, les analystes ne peuvent pas prédire quand les données seront plus dispersées et quand elles seront moins dispersées. C’est le cas des prix des produits financiers, y compris les stocks.

L’hétéroscédasticité inconditionnelle est prévisible. Les variables de nature cyclique présentent généralement cette propriété. Les variables dont la variance change avec leur niveau sont également hétroskédastiques inconditionnellement. Par exemple, vous pouvez prédire que si vous pouvez tenir quelque chose dans votre main, vous pouvez mesurer son poids assez précisément; vous pourriez être, tout au plus, quelques livres ou kilogrammes de moins. Si vous êtes invité à estimer le poids d’un bâtiment, cependant, vous pourriez être incorrect de milliers de livres ou de kilogrammes – la variance de votre estimation augmente, de manière prévisible, avec le poids de l’objet.

La présence ou non d’hétéroscédasticité a une incidence sur l’interprétation correcte de l’analyse statistique des données. La qualité n’affecte pas la régression; cela signifie que les méthodes de placement des graphes les mieux ajustés fonctionneront aussi bien avec les données hétéroscédastiques qu’homoscédastiques. Ces graphiques sont créés en trouvant les coefficients de données, qui mesurent dans quelle mesure une variable particulière affecte un résultat. L’hétéroscédasticité déforme les valeurs de la variance des coefficients renvoyées par les modèles.

Il existe une variété de tests mathématiques qui peuvent déterminer s’il existe une hétéroscédasticité sur un échantillon d’une variable. Beaucoup de ces tests sont disponibles dans un logiciel d’analyse statistique. Un observateur peut également détecter certains cas d’hétéroscédasticité en regardant un graphique de l’échantillon. Recherchez les zones du graphique qui sont plus ou moins dispersées; il est cependant important de faire la distinction entre les vraies variations de la quantité de dispersion et les grappes attendues dans les distributions qui ont un élément de caractère aléatoire.