Che cos’è una curva di distribuzione della frequenza?

Una curva di distribuzione della frequenza è un tipo di statistica descrittiva rappresentata come un grafico che dimostra la frequenza dell’occorrenza di una determinata variabile, dove x rappresenta una misura dell’occorrenza della variabile ey rappresenta il numero di casi a ciascuna frequenza. Con popolazioni molto grandi, si dice che una curva di distribuzione di frequenza assomigli all’ideale statistico di una curva a campana e assume le proprietà di una distribuzione normale. La curva a campana, nota anche come curva normale, ha un nome appropriato. Assomiglia a una campana arrotondata con estremità simmetriche che si assottigliano verso il basso e verso l’esterno verso una frequenza zero sull’asse x. La curva a campana è divisa in due dalla media identica idealizzata (μ), mediana e moda di tutti i dati misurati, con metà di ciascun grafico su entrambi i lati.

Quando si presume che una curva di distribuzione della frequenza campione possieda le proprietà di una curva a campana ideale, si possono assumere anche aspetti della popolazione oggetto di studio. Inoltre, le formule statistiche standard possono fornire un grado su cui si può fare affidamento su tali ipotesi. Con la curva a campana ideale, si presume che la media, la mediana e la moda di una popolazione siano tutte uguali. Il calcolo della deviazione standard, , fornisce quindi una misura dello “spread” dei dati della popolazione. Nella curva ideale, tutto tranne lo 0.25 percento dei dati totali di una popolazione si trova entro più o meno tre deviazioni standard dalla media della curva di distribuzione della frequenza, o tra μ-3σ e μ+3σ.

Sebbene la curva a campana ideale differisca da una curva di distribuzione della frequenza campione in vari modi, consente una comprensione presuntiva sia della popolazione campione che anche della posizione di una singola misurazione all’interno della popolazione campione complessiva. In una curva ideale, il 68% dei valori per la variabile misurata nel campione, e presumibilmente nella popolazione, sarà all’interno di una deviazione standard dalla media in entrambe le direzioni, o μ-1σ e μ+1σ. Spostandosi ulteriormente lungo la curva a campana, i valori per il 95% del campione e della popolazione si troveranno entro più o meno due deviazioni standard dalla media, o μ-2σ e μ+2σ. Ai margini della curva di distribuzione della frequenza, tutto tranne lo 0.25 percento rientra in più o meno tre deviazioni standard. Quelle rare misurazioni che si trovano nello 0.25 percento oltre le misure di tre deviazioni standard sono note come valori anomali e vengono spesso rimosse dai dati quando si verificano calcoli inferenziali.