Cosa sono le classi di istogramma?

Le classi istogramma sono intervalli di valori che contengono punti dati in una distribuzione di frequenza o tabulazione di dati grezzi. Sono anche indicati come intervalli, bin o larghezze bin. In un istogramma, un tipo di grafico a barre, queste classi sono rappresentate come colonne verticali in cui l’altezza della colonna indica il numero di punti dati contenuti nell’intervallo di classi. In genere, la scelta della classe dell’istogramma viene effettuata per migliorare la rappresentazione visiva delle statistiche o delle tendenze dei dati.

Quando c’è una grande quantità di dati da visualizzare, un istogramma è particolarmente utile per rappresentare la forma della sua distribuzione. Un intero intervallo di dati viene suddiviso in intervalli e il numero di punti dati che rientrano in ciascuno viene conteggiato per fornire la frequenza della classe. L’intervallo, o larghezza, dell’intervallo determina il numero di classi di istogrammi e influenza la forma del grafico.

Se l’intervallo è troppo ampio, le informazioni significative potrebbero essere omesse perché le classi sono troppo inclusive. Quando la scelta dell’ampiezza dell’intervallo è troppo ristretta, una frequenza di classe bassa potrebbe dare eccessiva importanza a quella che è in realtà una variazione casuale. Esistono diversi metodi per impostare un numero appropriato di classi di istogrammi per un set di dati.

Secondo la regola di Sturgis, il numero di classi dovrebbe essere vicino al log in base 2 del numero di punti dati, più uno. Usando la regola di Rice, il numero di classi definite dovrebbe essere il doppio della radice cubica del numero di punti dati. Qualunque sia il metodo utilizzato per selezionare il numero di classi di istogramma, si dovrebbero provare diverse larghezze per testare la sensibilità della forma dell’istogramma alla dimensione della classe. Il numero corretto di classi è quello che rappresenta in modo più accurato la distribuzione dei dati.

Con il numero corretto di classi di istogrammi per un intervallo di dati, dovrebbe risultare una rappresentazione grafica significativa che consenta una chiara interpretazione. Un istogramma dovrebbe mostrare il centro e la diffusione dei dati, qualsiasi asimmetria o asimmetria dei dati e valori anomali o punti dati che si verificano al di fuori dell’intervallo di valori previsto. La modalità, o il valore più frequente, dovrebbe essere evidente così come i raggruppamenti che potrebbero indicare una modalità multipla. L’analisi dell’istogramma potrebbe anche indicare errori nel processo di raccolta dei dati.

A lungo utilizzati nella finanza e nelle scienze sociali, gli istogrammi stanno diventando sempre più familiari nelle visualizzazioni grafiche dell’elettronica di consumo. La fotografia digitale è particolarmente aperta al loro uso, con molte fotocamere che incorporano un istogramma a colori per indicare il bilanciamento del bianco e l’esposizione. Un istogramma di fotografia digitale potrebbe anche mostrare i pixel come classi di istogrammi tracciate su sfumature di grigio.