O que é heteroscedasticidade?

Heteroscedasticidade é um termo estatístico usado para descrever o comportamento da variância e do desvio padrão de uma amostra. Se a qualidade estiver presente, a variância e o desvio padrão da variável não são constantes em todo o gráfico dos dados da amostra. Se essas medidas forem constantes, os dados serão considerados homocedásticos.

A variância de uma variável é uma medida de quão longe os valores observados estão espalhados da média, ou média, valor. O desvio padrão é a raiz quadrada da variância e é freqüentemente usado para descrever distribuições. De acordo com a relação descrita pelo teorema de Chebyshev, uma certa porcentagem dos dados deve estar dentro de cada desvio padrão do valor médio. Por exemplo, pelo menos 75 por cento dos pontos de dados em uma amostra devem estar dentro de dois desvios padrão da média. Assim, o desvio padrão de uma amostra fornece informações aproximadas sobre a posição relativa de cada ponto de dados.

Existem duas variedades de heteroscedasticidade: condicional e incondicional. Se os dados forem condicionalmente heteroscedásticos, os analistas não podem prever quando os dados estarão mais dispersos e quando serão menos dispersos. É o caso dos preços dos produtos financeiros, incluindo ações.

A heteroscedasticidade incondicional é previsível. Variáveis ​​que são cíclicas por natureza geralmente exibem essa propriedade. Variáveis ​​cuja variância muda com seu nível também são heteroscedásticas incondicionalmente. Por exemplo, você pode prever que, se puder segurar algo na mão, poderá medir seu peso com bastante precisão; você pode estar, no máximo, alguns libras ou quilogramas fora. Se você for solicitado a estimar o peso de um edifício, no entanto, pode estar incorreto em milhares de libras ou quilogramas – a variação de sua estimativa aumenta, previsivelmente, com o peso do objeto.

A presença ou não de heteroscedasticidade tem influência na interpretação adequada da análise estatística dos dados. A qualidade não afeta a regressão; isso significa que os métodos de colocação de gráficos de melhor ajuste funcionarão igualmente bem com dados heterocedásticos e homocedásticos. Esses gráficos são criados encontrando os coeficientes de dados, que medem o quanto uma determinada variável afeta um resultado. A heteroscedasticidade distorce os valores da variância dos coeficientes que os modelos retornam.

Existem vários testes matemáticos que podem determinar se há heteroscedasticidade presente em uma amostra de uma variável. Muitos desses testes estão disponíveis em software de análise estatística. Um observador também pode detectar alguns casos de heteroscedasticidade olhando para um gráfico da amostra. Procure áreas do gráfico que estão mais ou menos dispersas; é importante distinguir, no entanto, entre as variações verdadeiras na quantidade de dispersão e os clusters que são esperados em distribuições que têm um elemento de aleatoriedade.

SmartAsset.