O coeficiente de determinação é um cálculo matemático do quadrado de um coeficiente de correlação. O coeficiente de correlação é um cálculo da precisão de um modelo. Esses termos são usados em análises estatísticas para explicar cálculos razoavelmente lógicos.
Em estatística, o trabalho de um analista é observar os dados coletados de um cenário ou evento específico e criar um modelo matemático que explica os dados. Para criar este modelo, existem alguns fatos que precisam ser levados em consideração.
Existe a possibilidade de erro em todos os cálculos e coleta de dados. Uma vez que isso é consistente, a taxa de erro deve ser incorporada ao modelo. Ao contabilizar esse erro, ele deixa de ser relevante para determinar se o modelo proposto fornece uma explicação sólida para os dados.
O cálculo do coeficiente de determinação real é
R2 = Soma dos erros quadráticos
Soma dos erros quadrados + Soma da regressão dos quadrados
Este é um cálculo da precisão do modelo na explicação dos dados.
Usado na análise estatística, este valor fornece uma visão sobre a “qualidade do ajuste” do modelo estatístico aos dados. O valor do coeficiente está entre 0 e 1. Um ajuste perfeito do modelo para explicar a variação é 1 e 0 é o valor quando o modelo não explica a variação de forma alguma.
O coeficiente de determinação leva em consideração erros com os dados, ou outliers, e a soma dos quadrados da regressão. Não há unidade para este valor, pois é essencialmente uma razão e não está totalmente relacionado com o tamanho da amostra. Quanto maior o valor, próximo a 1, melhor explicação da variação está sendo fornecida pelo modelo.
Uma maneira simples de visualizar esse conceito é criar um gráfico de todos os dados que cercam um determinado evento. Disponha três bandejas de biscoitos em um refeitório, chocolate, amêndoa e amendoim. Observe as pessoas entrarem no refeitório e escreverem quantos biscoitos comem, que tipos e em que ordem. Trace esses dados em um gráfico.
Crie uma fórmula em torno do comportamento previsto. Um exemplo seria prever que toda pessoa que pegou 1 biscoito de chocolate, também pegou 2 amêndoas, mas nenhum amendoim. Uma equação linear simples pode ser escrita com base nesta suposição e representada graficamente.
Trace a linha que representa a equação linear dessa previsão. Compare a linha com a coleta de dados real em sua observação. Calcule o coeficiente de determinação para fornecer uma medida da precisão do comportamento previsto em comparação com os dados reais.
O coeficiente de determinação indica a quantidade de propagação dos dados ao redor da linha. Mostra o quão boa ou ruim a previsão foi, em comparação com os valores reais. O coeficiente de determinação permite aos usuários aplicar uma “verificação da realidade” aos dados propostos em um modelo estatístico. Existem dois valores, os valores observados ou reais e os valores modelados ou previstos.
Este tipo de análise estatística é muito comum na ciência e nos negócios. Muitas decisões de negócios são baseadas em previsões de comportamento futuro. É importante analisar os resultados reais e compará-los com as previsões. Este processo melhora o próximo modelo e, portanto, a precisão das previsões.