Che cos’è una variabile categoriale?

Una variabile categoriale, detta anche variabile nominale, è un tipo di variabile che può avere due o più gruppi, o categorie, che possono essere assegnati. Non esiste un ordine per le categorie a cui è possibile assegnare una variabile. In altre parole, le categorie non possono essere ordinate dalla più alta alla più bassa. Un esempio di variabile categoriale è la razza, che ha molte categorie diverse ma non vi è alcun ordinamento.

Un modo per determinare il tipo di variabile è se è quantitativo o qualitativo. Una variabile quantitativa può essere misurata e ha un valore numerico specifico. Esempi di variabili quantitative includono altezza, peso, età, stipendio, temperatura, ecc. Qualsiasi variabile non quantitativa è qualitativa o categoriale. Questi tipi di variabili non hanno alcun significato numerico quando vengono misurati o osservati e includono cose come il colore dei capelli, il colore degli occhi, il sesso, la città di nascita, ecc.

Le variabili categoriali sono simili alle variabili ordinali poiché entrambe hanno categorie specifiche che le descrivono. La differenza tra una variabile categoriale e una variabile ordinale è che quest’ultima ha un ordine intrinseco. Ad esempio, un sondaggio può chiedere agli intervistati di classificare le affermazioni come scarse, buone ed eccellenti. Queste sono variabili categoriali, ma c’è un ordine ovvio, quindi sono in realtà variabili ordinali.

Le tabelle di dati vengono in genere utilizzate per analizzare i dati raggruppati in modo categorico. Con una tabella dati a due vie, è possibile misurare e confrontare due variabili categoriali. Ad esempio, il colore dei capelli e il sesso potrebbero essere misurati per un gruppo di individui. Le variabili categoriche che verrebbero osservate e registrate sarebbero se la persona è maschio o femmina e di che colore sono i suoi capelli. Nella tabella, il numero di osservazioni per ogni gruppo per le due variabili verrebbe inserito in righe e colonne in base ai dati raccolti.

I grafici a barre sono spesso utilizzati come metodo grafico per analizzare i dati delle variabili categoriali. I dati che si osservano possono essere inseriti come numeri grezzi o come percentuali, che sono preferiti. Con un grafico a barre viene mostrato il totale per ogni gruppo.
Nell’esempio sopra, il grafico a barre potrebbe rappresentare il numero di maschi o femmine o il numero di individui all’interno di ciascuna categoria di colore dei capelli. Un grafico a barre segmentato può fornire un metodo per mostrare i numeri acquisiti durante le osservazioni invece di un totale diretto per ciascun gruppo. Utilizzando lo stesso colore di capelli e dati di genere, un grafico a barre segmentato potrebbe mostrare quanti maschi e femmine di ciascun colore di capelli sono stati osservati.