Cosa sono gli intervalli di confidenza?

Nelle statistiche, gli intervalli di confidenza vengono utilizzati come stime degli intervalli per i parametri della popolazione. Sono spesso utilizzati nella scienza e nell’ingegneria per test di ipotesi, controllo statistico dei processi e analisi dei dati. Sebbene sia possibile calcolare manualmente gli intervalli di confidenza, in genere è più semplice e molto più veloce utilizzare programmi di statistica specializzati o calcolatori grafici avanzati.

Se un’affermazione di probabilità della forma P(L≤θ≤U) = 1 – α può essere scritta in modo tale che L e U sono esclusivamente funzioni dei dati del campione e θ è un parametro, allora l’intervallo tra L e U è una confidenza intervallo. Questa definizione può essere formulata in modo più intuitivo e pratico dicendo che un’affermazione che il parametro θ si trova nell’intervallo di confidenza sarà vera il 100(1 – α)% delle volte che l’affermazione è fatta. Il termine (1 – α) è noto come coefficiente di confidenza.

Per il caso di una popolazione distribuita normalmente con media nota μ e varianza nota σ2, l’intervallo di confidenza 100(1 – α) attorno alla media può essere calcolato dall’equazione x – zα/2σ/√n ≤ μ ≤ x + zα/ 2σ/√n, in cui zα/2 è il 100α/2 punto percentuale superiore della curva di distribuzione normale standard. Questo è un caso semplice, perché la media e la varianza vere dell’intera popolazione di solito non sono note.

Gli intervalli di confidenza vengono utilizzati più spesso per determinare quanto bene un determinato parametro si adatta a un determinato set di dati. Ad esempio, se l’intervallo di confidenza per un dato set di dati va da 45 a 55 con un coefficiente di confidenza di 0.95, si potrebbe sostenere che qualsiasi punto di dati che rientra in questa regione appartiene alla popolazione con il 95% di confidenza. Aumentando il coefficiente di confidenza si restringe l’intervallo, il che significa che un intervallo di variabili più piccolo può essere spiegato con maggiore sicurezza. Diminuendo il coefficiente di confidenza si allarga l’intervallo ma si diminuisce la confidenza.

Per alcune applicazioni, come le popolazioni normalmente distribuite con medie e varianze note, le equazioni utilizzate per calcolare gli intervalli di confidenza sono facilmente disponibili. Le tabelle statistiche possono essere utilizzate per trovare i valori per zα/2. Altre applicazioni, come l’analisi dei dati in ingegneria, richiedono metodi di calcolo più sofisticati. Di solito è più pratico utilizzare un programma statistico per determinare gli intervalli di confidenza per questi casi. I programmi di statistica possono essere particolarmente utili quando i set di dati sono estremamente grandi ei risultati devono essere presentati graficamente.