El teorema del límite central en estadística establece que la suma o media de un gran número de variables aleatorias se aproxima a la distribución normal. También se puede aplicar a distribuciones binomiales. Cuanto mayor sea el tamaño de la muestra, más cercana será la distribución a la distribución normal.
La distribución normal, a la que se aproxima el teorema del límite central, tiene la forma de una curva de campana simétrica. Las distribuciones normales se describen mediante la media, que está representada por la letra griega mu, y la desviación estándar, representada por sigma. La media es simplemente el promedio y es el punto en el que la curva de campana alcanza su punto máximo. Las desviaciones estándar indican qué tan dispersas están las variables en la distribución: una desviación estándar más baja resultará en una curva más estrecha.
La forma en que se distribuyen las variables aleatorias no importa para el teorema del límite central: la suma o la media de las variables aún se acercará a una distribución normal si hay un tamaño de muestra lo suficientemente grande. El tamaño de la muestra de las variables aleatorias es importante porque las muestras aleatorias se extraen de la población para obtener la suma o la media. Tanto el número de muestras extraídas como el tamaño de esas muestras son importantes.
Para calcular una suma de una muestra extraída de variables aleatorias, primero se elige un tamaño de muestra. El tamaño de la muestra puede ser tan pequeño como dos o puede ser muy grande. Se extrae al azar y luego se suman las variables de la muestra. Este procedimiento se repite muchas veces y los resultados se grafican en una curva de distribución estadística. Si el número de muestras y el tamaño de la muestra son lo suficientemente grandes, la curva estará muy cerca de la distribución normal.
Las muestras se extraen para las medias en el teorema del límite central de la misma manera que para las sumas, pero en lugar de sumar, se calcula el promedio de cada muestra. Un tamaño de muestra más grande da resultados más cercanos a la distribución normal y, por lo general, también da como resultado una desviación estándar más pequeña. En cuanto a las sumas, un mayor número de muestras da una mejor aproximación a la distribución normal.
El teorema del límite central también se aplica a las distribuciones binomiales. Las distribuciones binomiales se utilizan para eventos con solo dos resultados posibles, como lanzar una moneda. Estas distribuciones se describen por el número de ensayos realizados, n, y la probabilidad de éxito, p, para cada ensayo. Las desviaciones media y estándar para una distribución binomial se calculan utilizando n y p. Cuando n es muy grande, las desviaciones media y estándar serán las mismas para la distribución binomial que para la distribución normal.