Uma distribuição enviesada refere-se a uma distribuição de probabilidade que é de natureza desigual e assimétrica. Ao contrário de uma distribuição normal padrão, que se assemelha a uma curva em forma de sino, as distribuições enviesadas são deslocadas para um lado, possuindo uma cauda mais longa de um lado em relação ao outro lado da mediana. O outro lado da curva possuirá um pico agrupado de valores onde ocorre a maioria dos pontos de dados. Esse tipo de curva de distribuição é geralmente classificado como tendo uma inclinação positiva ou negativa, dependendo da direção do deslocamento da curva.
Geralmente, diz-se que uma distribuição inclinada possui inclinação positiva se a cauda da curva for mais longa no lado direito do que no lado esquerdo. Essa distribuição distorcida também é conhecida como distorcida para a direita porque o lado direito possui uma extensão mais ampla de pontos de dados. As curvas de inclinação positiva possuem o maior número de valores em direção ao lado esquerdo da curva.
Em contraste, as distribuições com inclinação negativa possuem a maioria dos pontos de dados no lado direito da curva. Essas curvas têm caudas mais longas nos lados esquerdos, então é dito que elas estão inclinadas para a esquerda. Uma regra importante para determinar a direção da inclinação é considerar o comprimento da cauda em vez da localização da média ou mediana. Isso ocorre porque a inclinação é causada, em última análise, pelos valores mais distantes, que estendem a curva em direção a esse lado do gráfico.
Compreender as propriedades de uma distribuição distorcida é importante em muitas aplicações estatísticas. Muitas pessoas presumem que os dados seguem uma curva em sino, ou distribuição normal, então também presumem que um gráfico tem distorção zero. Essas suposições, no entanto, podem levá-los a interpretar mal as informações sobre a distribuição real.
Uma distribuição enviesada é inerentemente desigual por natureza, portanto, não seguirá os padrões normais padrão, como o desvio padrão. As distribuições normais envolvem um desvio padrão que se aplica a ambos os lados da curva, mas as distribuições enviesadas terão valores de desvio padrão diferentes para cada lado da curva. Isso ocorre porque os dois lados não são imagens espelhadas um do outro, então as equações que descrevem um lado não podem ser aplicadas ao outro. O valor do desvio padrão é geralmente maior para o lado com a cauda mais longa porque há uma maior distribuição de dados naquele lado em comparação com a cauda mais curta.