La varianza, come l’intervallo, è una statistica correlata alla diffusione di un dato campione o popolazione. Viene calcolato per una data popolazione sommando i quadrati della differenza tra ciascun elemento e la media, quindi dividendo quel totale per il numero di elementi nella popolazione. Più una popolazione è raggruppata attorno alla media, minore sarà la varianza.
Una statistica strettamente correlata è la deviazione standard, che è la radice quadrata della varianza. La deviazione standard è utilizzata più frequentemente nelle statistiche descrittive perché è più intuitiva e condivide le stesse unità della media. Nella distribuzione normale, che è la classica curva di distribuzione a campana comune a molti fenomeni, poco più del 95% della popolazione si troverà all’interno di due deviazioni standard della media.
La varianza è molto utile per le tecniche statistiche predittive come la regressione o l’analisi della varianza (ANOVA). La regressione modellerà una variabile come la somma di uno o più fattori che influenzano la variabile e la varianza, che rappresenta la differenza tra gli elementi osservati effettivi e i loro valori attesi. Ad esempio, l’occupazione nell’edilizia in una città potrebbe essere modellata come livello base, più un aggiustamento stagionale per il periodo dell’anno, più un aggiustamento per l’economia nazionale, più la varianza. Le tecniche di regressione tentano di determinare un modello con la varianza più piccola, in modo che si spera che il valore atteso della previsione sia vicino al valore osservato dopo che l’osservazione è possibile.
L’ANOVA, comunemente usata negli studi clinici, è una tecnica statistica per classificare le fonti di varianza. Le osservazioni sono classificate in base a uno o più fattori di interesse in un esperimento. Le tecniche dei minimi quadrati vengono utilizzate per suddividere la varianza in errore casuale, effetti fattoriali ed effetti di interazione, con l’obiettivo di determinare l’influenza che il fattore oi fattori hanno sulla variabile. Ad esempio, un’azienda che sta testando un nuovo fertilizzante potrebbe utilizzare un esperimento ANOVA con la resa del raccolto come variabile studiata e fattori di quale fertilizzante è stato utilizzato e quanta pioggia ha ricevuto le colture. Come il nuovo fertilizzante rispetto ad altri fertilizzanti sarebbe un effetto fattore nell’esperimento; se il nuovo fertilizzante avesse prestazioni superiori ai suoi rivali per le precipitazioni standard ma non per le piogge abbondanti, questo sarebbe un esempio di effetto di interazione.