Qu’est-ce qu’un coefficient de détermination?

Le coefficient de détermination est un calcul mathématique du carré d’un coefficient de corrélation. Le coefficient de corrélation est un calcul de la précision d’un modèle. Ces termes sont utilisés dans l’analyse statistique pour expliquer des calculs assez logiques.

En statistiques, le travail d’un analyste consiste à examiner les données collectées à partir d’un scénario ou d’un événement spécifique et de créer un modèle mathématique qui explique les données. Afin de créer ce modèle, certains faits doivent être pris en considération.

Il existe une possibilité d’erreur dans chaque calcul et collecte de données. Comme cela est cohérent, le taux d’erreur doit être intégré au modèle. En tenant compte de cette erreur, il cesse d’être pertinent pour déterminer si le modèle proposé fournit une explication solide des données.

Le calcul du coefficient de détermination réel est

R2 = Somme des erreurs au carré

Somme des carrés des erreurs + Somme de régression des carrés

Il s’agit d’un calcul de la précision du modèle pour expliquer les données.

Utilisée dans l’analyse statistique, cette valeur donne un aperçu de la «qualité de l’ajustement» du modèle statistique aux données. La valeur du coefficient est comprise entre 0 et 1. Un ajustement parfait du modèle pour expliquer la variation est 1 et 0 est la valeur lorsque le modèle n’explique pas du tout la variation.

Le coefficient de détermination prend en compte les erreurs avec les données, ou valeurs aberrantes, et la somme des carrés de régression. Il n’y a pas d’unité pour cette valeur, car il s’agit essentiellement d’un rapport et n’a aucun rapport avec la taille de l’échantillon. Plus la valeur est élevée, proche de 1, meilleure est l’explication de la variation fournie par le modèle.

Un moyen simple de visualiser ce concept est de créer un graphique de toutes les données entourant un événement particulier. Disposez trois plateaux de biscuits dans une salle à manger, du chocolat, des amandes et des arachides. Observez les gens entrer dans la salle à manger et notez combien de biscuits ils prennent, quels types et dans quel ordre. Tracez ces données sur un graphique.

Créez une formule autour du comportement prédit. Un exemple serait de prédire que chaque personne qui a pris 1 biscuit au chocolat, a également pris 2 amandes, mais pas de cacahuètes. Une équation linéaire simple peut être écrite sur la base de cette hypothèse et représentée graphiquement.

Tracez la ligne qui représente l’équation linéaire de cette prédiction. Comparez la ligne à la collecte de données réelle dans votre observation. Calculez le coefficient de détermination pour fournir une mesure de la précision du comportement prévu par rapport aux données réelles.

Le coefficient de détermination indique la quantité de propagation des données autour de la ligne. Il montre à quel point la prédiction était bonne ou mauvaise, par rapport aux valeurs réelles. Le coefficient de détermination permet aux utilisateurs d’appliquer un « contrôle de la réalité » aux données proposées dans un modèle statistique. Il existe deux valeurs, les valeurs observées ou réelles et les valeurs modélisées ou prédites.

Ce type d’analyse statistique est très courant dans la science et dans les affaires. De nombreuses décisions commerciales sont basées sur des prédictions de comportement futur. Il est important d’analyser les résultats réels et de les comparer aux prévisions. Ce processus améliore le prochain modèle et donc la précision des prédictions.