¿Qué es una curva de distribución de frecuencia?

Una curva de distribución de frecuencia es un tipo de estadística descriptiva representada como un gráfico que demuestra la frecuencia de ocurrencia de una variable dada, donde x representa alguna medida de ocurrencia de la variable ey representa el número de casos en cada frecuencia. Con poblaciones muy grandes, se dice que una curva de distribución de frecuencia se asemeja al ideal estadístico de una curva de campana y asume las propiedades de una distribución normal. La curva de campana, también conocida como curva normal, se llama acertadamente. Se asemeja a una campana redondeada con extremos simétricos que se estrechan hacia abajo y hacia afuera hacia una frecuencia cero en el eje x. La curva de campana está dividida en dos por la media idéntica idealizada (μ), la mediana y la moda de todos los datos medidos, con la mitad de cada gráfico a cada lado.

Cuando se supone que una curva de distribución de frecuencia de muestra posee las propiedades de una curva de campana ideal, también se pueden asumir aspectos de la población en estudio. Además, las fórmulas estadísticas estándar pueden dar un grado en el que se puede confiar en tales supuestos. Con la curva de campana ideal, se supone que la media, la mediana y la moda de una población son iguales. El cálculo de la desviación estándar, σ, da una medida de la «dispersión» de los datos de la población. En la curva ideal, todos menos el 0.25 por ciento de los datos totales de una población se encuentran dentro de más o menos tres desviaciones estándar de la media de la curva de distribución de frecuencia, o entre μ-3σ y μ + 3σ.

Si bien la curva de campana ideal difiere de una curva de distribución de frecuencia de muestra en varias formas, permite cierta comprensión supuesta de la población de muestra e incluso de la ubicación de una sola medición dentro de la población de muestra general. En una curva ideal, el 68 por ciento de los valores de la variable medida en la muestra, y presumiblemente en la población, estarán dentro de una desviación estándar de la media en cualquier dirección, o μ-1σ y μ + 1σ. Moviéndose más a lo largo de la curva de campana, los valores para el 95 por ciento de la muestra y la población se ubicarán dentro de más o menos dos desviaciones estándar de la media, o μ-2σ y μ + 2σ. En los mismos bordes de la curva de distribución de frecuencia, todo menos el 0.25 por ciento cae dentro de más o menos tres desviaciones estándar. Esas medidas raras que se encuentran en el 0.25 por ciento más allá de las medidas de tres desviaciones estándar se conocen como valores atípicos y, a menudo, se eliminan de los datos cuando se realizan cálculos inferenciales.