Que sont les intervalles de confiance ?

En statistique, les intervalles de confiance sont utilisés comme estimations d’intervalle pour les paramètres de population. Ils sont fréquemment utilisés en science et en ingénierie pour les tests d’hypothèses, le contrôle statistique des processus et l’analyse des données. Bien qu’il soit possible de calculer les intervalles de confiance à la main, il est généralement plus facile et beaucoup plus rapide d’utiliser des programmes statistiques spécialisés ou des calculatrices graphiques avancées.

Si un énoncé de probabilité de la forme P(L≤θ≤U) = 1 – α peut être écrit de telle sorte que L et U sont exclusivement des fonctions des données de l’échantillon et est un paramètre, alors l’intervalle entre L et U est une confiance intervalle. Cette définition peut être énoncée d’une manière plus intuitive et pratique en disant qu’une déclaration selon laquelle le paramètre θ se situe dans l’intervalle de confiance sera vraie 100(1 – α)% des fois que la déclaration est faite. Le terme (1 – α) est appelé coefficient de confiance.

Pour le cas d’une population normalement distribuée avec une moyenne connue μ et une variance connue σ2, l’intervalle de confiance 100(1 – α) autour de la moyenne peut être calculé par l’équation x – zα/2σ/√n ≤ μ ≤ x + zα/ 2σ/√n, dans lequel zα/2 est le 100α/2 point de pourcentage supérieur de la courbe de distribution normale standard. Il s’agit d’un cas simple, car la vraie moyenne et la variance de l’ensemble de la population ne sont généralement pas connues.

Les intervalles de confiance sont le plus souvent utilisés pour déterminer dans quelle mesure un certain paramètre s’intègre dans un ensemble de données donné. Par exemple, si l’intervalle de confiance pour un ensemble de données donné s’étend de 45 à 55 avec un coefficient de confiance de 0.95, on pourrait soutenir que tout point de données qui se situe dans cette région appartient à la population avec une confiance de 95 %. L’augmentation du coefficient de confiance resserre l’intervalle, ce qui signifie qu’une plus petite gamme de variables peut être expliquée avec une plus grande confiance. La diminution du coefficient de confiance élargit l’intervalle mais diminue la confiance.

Pour certaines applications, telles que les populations normalement distribuées avec des moyennes et des variances connues, les équations utilisées pour calculer les intervalles de confiance sont facilement disponibles. Les tableaux de statistiques peuvent être utilisés pour trouver des valeurs pour zα/2. D’autres applications, telles que l’analyse de données en ingénierie, nécessitent des méthodes de calcul plus sophistiquées. Il est généralement plus pratique d’utiliser un programme statistique pour déterminer les intervalles de confiance pour ces cas. Les programmes de statistiques peuvent être particulièrement utiles lorsque les ensembles de données sont extrêmement volumineux et que les résultats doivent être présentés sous forme graphique.