Qu'est-ce qu'une courbe de distribution de fréquence ?

Une courbe de distribution de fréquence est un type de statistiques descriptives représentées sous la forme d’un graphique qui démontre la fréquence d’occurrence d’une variable donnée, où x représente une certaine mesure de l’occurrence de la variable et y représente le nombre d’observations à chaque fréquence. Avec de très grandes populations, on dit qu’une courbe de distribution de fréquence ressemble à l’idéal statistique d’une courbe en cloche et assume les propriétés d’une distribution normale. La courbe en cloche – également connue sous le nom de courbe normale – porte bien son nom. Il ressemble à une cloche arrondie avec des extrémités symétriques se rétrécissant vers une fréquence nulle sur l’axe des x. La courbe en cloche est coupée en deux par la moyenne identique idéalisée (μ), la médiane et le mode de toutes les données mesurées, avec la moitié de chaque graphique de chaque côté.

Lorsqu’une courbe de distribution de fréquence d’échantillonnage est supposée posséder les propriétés d’une courbe en cloche idéale, alors les aspects de la population à l’étude peuvent également être supposés. De plus, les formules statistiques standard peuvent donner un degré auquel de telles hypothèses peuvent être invoquées. Avec la courbe en cloche idéale, la moyenne, la médiane et le mode d’une population sont tous supposés égaux. Le calcul de l’écart type, , donne alors une mesure de la propagation des données de population. Dans la courbe idéale, tout sauf 0.25 pour cent des données totales d’une population se trouve à plus ou moins trois écarts types de la moyenne de la courbe de distribution de fréquence, ou entre -3σ et μ+3σ.

Bien que la courbe en cloche idéale diffère d’une courbe de distribution de fréquence d’échantillonnage de plusieurs manières, elle permet une compréhension hypothétique à la fois de la population de l’échantillon et même de l’emplacement d’une seule mesure au sein de la population globale de l’échantillon. Dans une courbe idéale, 68 pour cent des valeurs de la variable mesurées dans l’échantillon, et vraisemblablement dans la population, seront à moins d’un écart type de la moyenne dans les deux sens, ou μ-1σ et μ+1σ. En allant plus loin le long de la courbe en cloche, les valeurs pour 95 pour cent de l’échantillon et de la population seront situées à plus ou moins deux écarts types par rapport à la moyenne, ou μ-2σ et μ+2σ. Aux bords mêmes de la courbe de distribution de fréquence, tout sauf 0.25 pour cent se situe à plus ou moins trois écarts types. Ces mesures rares qui se situent dans les 0.25% au-delà des mesures de trois écarts types sont appelées valeurs aberrantes et sont souvent supprimées des données lors des calculs inférentiels.