Qu’est-ce qu’un écart ?

La variance, comme la plage, est une statistique liée à la répartition d’un échantillon ou d’une population donnée. Il est calculé pour une population donnée en additionnant les carrés de la différence entre chaque élément et la moyenne, puis en divisant ce total par le nombre d’éléments de la population. Plus une population est regroupée autour de la moyenne, plus la variance sera faible.

Une statistique étroitement liée est l’écart type, qui est la racine carrée de la variance. L’écart type est plus fréquemment utilisé dans les statistiques descriptives car il est plus intuitif et partage les mêmes unités que la moyenne. Dans la distribution normale, qui est la courbe de distribution classique en forme de cloche commune à de nombreux phénomènes, un peu plus de 95 pour cent de la population se situera à moins de deux écarts types de la moyenne.

La variance est particulièrement utile pour les techniques statistiques prédictives telles que la régression ou l’analyse de la variance (ANOVA). La régression modélisera une variable comme la somme d’un ou plusieurs facteurs qui influencent la variable et la variance, qui représente la différence entre les éléments réellement observés et leurs valeurs attendues. Par exemple, l’emploi dans la construction dans une ville peut être modélisé comme un niveau de base, plus un ajustement saisonnier pour la période de l’année, plus un ajustement pour l’économie nationale, plus la variance. Les techniques de régression tentent de déterminer un modèle avec la plus petite variance, de sorte que la valeur attendue de la prédiction soit, espérons-le, proche de la valeur observée une fois que l’observation est possible.

L’ANOVA, couramment utilisée dans les essais cliniques, est une technique statistique pour classer les sources de variance. Les observations sont classées par un ou plusieurs facteurs d’intérêt dans une expérience. Les techniques des moindres carrés sont utilisées pour diviser la variance en erreurs aléatoires, effets de facteurs et effets d’interaction, dans le but de déterminer l’influence du ou des facteurs sur la variable. Par exemple, une entreprise qui teste un nouvel engrais pourrait utiliser une expérience ANOVA avec le rendement des cultures comme variable étudiée et les facteurs dont l’engrais a été utilisé et la quantité de pluie reçue par les cultures. Comment le nouvel engrais par rapport à d’autres engrais serait un effet de facteur dans l’expérience ; si le nouvel engrais surpassait ses concurrents pour les précipitations standard mais pas pour les fortes précipitations, ce serait un exemple d’effet d’interaction.