La creación de un histograma es una forma eficaz de mostrar datos univariados de manera que refleje la distribución de frecuencia de los datos. Hay varias variables a considerar al crear histogramas, que van desde el análisis real de los datos sin procesar hasta las preferencias de la audiencia destinataria. Al crear el histograma óptimo, se debe considerar cuidadosamente la naturaleza de los datos, el análisis de los datos, las preferencias de la audiencia y el software o los materiales disponibles.
Antes de crear un histograma, es importante considerar la naturaleza de los datos que se van a analizar. Los histogramas se utilizan generalmente para mostrar la distribución de conjuntos de datos univariados. Más específicamente, los histogramas son una representación visual de la distribución de frecuencia de los datos o la función de densidad de probabilidad. Es aconsejable que uno considere gráficos alternativos que podrían representar mejor los datos antes de construir un histograma.
Si un histograma es de hecho la mejor opción para representar los datos, la siguiente variable a considerar es la audiencia prevista. Los profesores universitarios, los maestros de matemáticas de la escuela secundaria, los gerentes de ingeniería y los consumidores de medios pueden tener expectativas y demandas diferentes. Por ejemplo, un profesor de matemáticas puede desear ver un histograma construido en papel cuadriculado a mano para una tarea en estadística, mientras que un gerente de ingeniería puede desear ver un histograma en un formato específico requerido por la empresa. En todos los casos, las etiquetas de fácil lectura en los ejes y la construcción ordenada y precisa son características deseables.
La creación de un histograma a mano es el método que más a menudo encuentran los estudiantes de estadística. Para comenzar, los tamaños de los contenedores se calculan y etiquetan en una escala horizontal. En la práctica, la raíz cuadrada del número de observaciones en el conjunto de datos se puede utilizar para determinar el número de bins uniformemente espaciados. A continuación, se marca una escala vertical con las frecuencias de intervalo o frecuencias relativas. Sobre cada contenedor, se usa una regla para dibujar un rectángulo con una altura igual a la frecuencia correspondiente del contenedor, y los ejes están claramente etiquetados.
Los paquetes de software también se pueden utilizar para crear un histograma. Los programas de estadística modernos ofrecen una variedad de servicios que se extienden más allá de la construcción del histograma en sí. Estos programas pueden producir histogramas de color, predecir la normalidad de los datos, ofrecer predicciones de la función de densidad de probabilidad superpuesta a los datos en sí y calcular estadísticas simples. Para el trabajo profesional, los paquetes de software suelen ser la mejor opción para crear un histograma debido a la sofisticación adicional en el análisis y la presentación mejorada.