Qu’est-ce que le théorème central limite ?

Le théorème central limite en statistique stipule que la somme ou la moyenne d’un grand nombre de variables aléatoires se rapproche de la distribution normale. Il peut également être appliqué aux distributions binomiales. Plus la taille de l’échantillon est grande, plus la distribution sera proche de la distribution normale.

La distribution normale, qui est approchée par le théorème central limite, a la forme d’une courbe en cloche symétrique. Les distributions normales sont décrites par la moyenne, qui est représentée par la lettre grecque mu, et l’écart type, représenté par sigma. La moyenne est simplement la moyenne, et c’est le point auquel la courbe en cloche culmine. Les écarts-types indiquent l’étendue des variables dans la distribution — un écart-type inférieur se traduira par une courbe plus étroite.

La façon dont les variables aléatoires sont distribuées n’a pas d’importance pour le théorème central limite – la somme ou la moyenne des variables s’approchera toujours d’une distribution normale si la taille de l’échantillon est suffisamment grande. La taille de l’échantillon des variables aléatoires est importante car des échantillons aléatoires sont tirés de la population pour obtenir la somme ou la moyenne. Le nombre d’échantillons prélevés et la taille de ces échantillons sont tous deux importants.

Pour calculer une somme à partir d’un échantillon tiré de variables aléatoires, une taille d’échantillon est d’abord choisie. La taille de l’échantillon peut être aussi petite que deux, ou elle peut être très grande. Il est tiré au hasard, puis les variables de l’échantillon sont additionnées. Cette procédure est répétée plusieurs fois et les résultats sont représentés graphiquement sur une courbe de distribution statistique. Si le nombre d’échantillons et la taille de l’échantillon sont suffisamment grands, la courbe sera très proche de la distribution normale.

Des échantillons sont tirés pour les moyennes dans le théorème central limite de la même manière que pour les sommes, mais au lieu d’additionner, la moyenne de chaque échantillon est calculée. Une taille d’échantillon plus grande donne des résultats plus proches de la distribution normale et entraîne généralement également un écart type plus petit. Quant aux sommes, un plus grand nombre d’échantillons donne une meilleure approximation de la distribution normale.

Le théorème central limite s’applique également aux distributions binomiales. Les distributions binomiales sont utilisées pour des événements avec seulement deux résultats possibles, comme lancer une pièce. Ces distributions sont décrites par le nombre d’essais effectués, n, et la probabilité de succès, p, pour chaque essai. La moyenne et les écarts types pour une distribution binomiale sont calculés en utilisant n et p. Lorsque n est très grand, la moyenne et les écarts types seront les mêmes pour la distribution binomiale que pour la distribution normale.