Las clases de histograma son rangos de valores que contienen puntos de datos en una distribución de frecuencia o tabulación de datos sin procesar. También se denominan intervalos, contenedores o anchos de contenedor. En un histograma, un tipo de gráfico de barras, estas clases se representan como columnas verticales donde la altura de la columna indica el número de puntos de datos contenidos en el rango de clases. Normalmente, la elección de la clase de histograma se realiza para mejorar la representación visual de las estadísticas o tendencias de los datos.
Cuando hay una gran cantidad de datos para mostrar, un histograma es particularmente útil para representar la forma de su distribución. Un rango completo de datos se divide en intervalos y el número de puntos de datos que caen en cada uno se cuenta para dar la frecuencia de clase. El rango, o ancho, del intervalo determina el número de clases de histograma e influye en la forma del gráfico.
Si el intervalo es demasiado amplio, las clases pueden omitir información significativa porque son demasiado inclusivas. Cuando la elección del ancho del intervalo es demasiado estrecha, la frecuencia de clase baja puede dar una importancia indebida a lo que en realidad es una variación aleatoria. Existen varios métodos para establecer un número apropiado de clases de histograma para un conjunto de datos.
Según la regla de Sturgis, el número de clases debe estar cerca del logaritmo de base 2 del número de puntos de datos, más uno. Usando la regla de Rice, el número de clases definidas debe ser el doble de la raíz cúbica del número de puntos de datos. Cualquiera que sea el método que se utilice para seleccionar el número de clases de histograma, se deben probar varios anchos diferentes para probar la sensibilidad de la forma del histograma al tamaño de la clase. El número correcto de clases es el que describe con mayor precisión la distribución de los datos.
Con el número adecuado de clases de histograma para un rango de datos, debería resultar una representación gráfica significativa que permita una interpretación clara. Un histograma debe mostrar el centro y la extensión de los datos, cualquier asimetría o asimetría de datos y valores atípicos o puntos de datos que se produzcan fuera del rango de valores esperado. La moda, o el valor que ocurre con más frecuencia, debe ser evidente, así como las agrupaciones que podrían indicar una modalidad múltiple. El análisis de histograma también puede indicar fallas en el proceso de recopilación de datos.
Utilizados durante mucho tiempo en finanzas y ciencias sociales, los histogramas se están volviendo más familiares en las pantallas gráficas de la electrónica de consumo. La fotografía digital está particularmente abierta a su uso, y muchas cámaras incorporan un histograma de color para indicar el balance de blancos y la exposición. Un histograma de fotografía digital también puede mostrar píxeles como clases de histograma trazadas en tonos de gris.