La desviación estándar es un valor estadístico que se utiliza para determinar qué tan dispersos están los datos en una muestra y qué tan cerca están los puntos de datos individuales del valor medio (o promedio) de la muestra. Una desviación estándar de un conjunto de datos igual a cero indica que todos los valores del conjunto son iguales. Un valor mayor implica que los puntos de datos individuales están más lejos del valor medio.
En una distribución normal de datos, también conocida como curva de campana, la mayoría de los datos de la distribución (aproximadamente el 68%) estarán dentro de más o menos una desviación estándar de la media. Por ejemplo, si la desviación estándar de un conjunto de datos es 2, la mayoría de los datos del conjunto estarán dentro de 2 más o 2 menos que la media. Aproximadamente el 95.5% de los datos distribuidos normalmente están dentro de dos desviaciones estándar de la media, y más del 99% están dentro de tres.
Para calcular la desviación estándar, los estadísticos primero calculan el valor medio de todos los puntos de datos. La media es igual a la suma de todos los valores del conjunto de datos dividida por el número total de puntos de datos. A continuación, se calcula la desviación de cada punto de datos del promedio restando su valor del valor medio. La desviación de cada punto de datos se eleva al cuadrado y las desviaciones cuadradas individuales se promedian juntas. El valor resultante se conoce como varianza. La desviación estándar es la raíz cuadrada de la varianza.
Normalmente, los estadísticos encuentran la desviación estándar de una muestra de una población y la utilizan para representar a toda la población. Encontrar los datos exactos para una gran población no es práctico, si no imposible, por lo que utilizar una muestra representativa suele ser el mejor método. Por ejemplo, si alguien quisiera encontrar el número de hombres adultos en el estado de California que pesaban entre 180 y 200 libras, podría medir el peso de un pequeño número de hombres y calcular su promedio, varianza y desviación estándar, y asumir que los mismos valores son válidos para la población en su conjunto.
Además de los usos del análisis estadístico, la desviación estándar también se puede utilizar para determinar la cantidad de riesgo y volatilidad asociados con una inversión en particular. Los inversores pueden calcular la desviación estándar anual de los rendimientos de una inversión y usar ese número para determinar qué tan volátil es la inversión. Una desviación estándar mayor implicaría una inversión más arriesgada, suponiendo que la estabilidad fuera el resultado deseado.