In statistica, media e mediana sono diverse misure della tendenza centrale in un insieme di dati, o la tendenza dei numeri a raggrupparsi attorno a un particolare valore. In un gruppo di valori, potrebbe essere desiderabile trovare quello più tipico. Un modo per farlo è trovare la media, o media, che è la somma di tutti i valori divisa per il numero totale di valori. Un altro modo è trovare il valore mediano, o medio, che è quello al centro di un elenco ordinato di numeri. Il metodo migliore da utilizzare dipende dall’applicazione e dalla natura dei dati.
Significare
Ottenere la media di qualcosa equivale a ottenere il numero medio in un set di dati. La somma dei valori nell’insieme viene divisa per il numero di valori. Ad esempio, un insegnante potrebbe valutare cinque punteggi del test, tutti ponderati allo stesso modo, per determinare un voto per uno studente. Se i cinque punteggi del test sono 80, 85, 60, 90 e 100, questi numeri vengono sommati per ottenere una somma di 415, che viene divisa per 5 per ottenere il punteggio medio di 83. Dopo aver calcolato questo, l’insegnante può assegnare un voto allo studente.
Mediano
In una misurazione mediana, i dati sono disposti dal più basso al più alto: 60, 80, 85, 90 e 100. Il numero centrale in questo set è la mediana. In questo esempio, la mediana è 85, il terzo e medio numero del set. Questo varia leggermente dalla media di 83. Un insegnante potrebbe voler guardare un punteggio medio, poiché tende a escludere un punteggio insolitamente basso, come 60, che abbasserebbe la media.
Dove il numero di valori è pari, viene presa una media dei due numeri centrali. Questi due numeri vengono sommati e divisi per due. Ad esempio, in una classe di dieci studenti i punteggi in un test potrebbero essere, in ordine crescente, 48, 56, 57, 61, 65, 68, 68, 71, 77 e 82. La mediana per questo set di dati sarebbe il media del quinto e del sesto numero, 65 e 68, che è 66.5.
Applicazioni
Questi metodi sono entrambi utilizzati per trovare un valore “tipico” da un insieme di dati. La media è la misura più comunemente usata della tendenza centrale, ma ci sono casi in cui non è appropriata. Ad esempio, i dati possono essere “asimmetrici”, il che significa che la maggior parte dei numeri è verso l’estremità inferiore o superiore della scala, o che esiste un valore che è molto diverso da tutti gli altri – questo è noto come un valore anomalo. Soprattutto in un piccolo insieme di dati, il valore medio in questi casi non sarà tipico.
Ad esempio, se cinque studenti sostengono un test e i punteggi sono 24, 85, 89, 91 e 95, il punteggio medio è 60.6. Questo, tuttavia, non è tipico: la media è stata ridotta di un punteggio marginale di 24, probabilmente perché uno studente non aveva studiato. In questo caso, la mediana di 89 è molto più tipica.
Un altro metodo usato occasionalmente è la modalità, che è semplicemente il valore più comune in un set di dati. A volte viene utilizzato quando i possibili valori in un insieme di dati sono limitati e si escludono a vicenda. Ad esempio, potrebbe essere condotto un sondaggio tra i proprietari di computer portatili per trovare il marchio più popolare. In questo caso, una marca media o mediana non avrebbe senso e la marca più popolare sarebbe la moda.
Per fare un esempio in cui potrebbero essere utilizzati tutti e tre i metodi, potrebbero essere raccolti alcuni dati relativi ai dipendenti di un’azienda. Un’analisi potrebbe calcolare lo stipendio medio, ma questo può essere distorto da un piccolo numero di dipendenti molto alti nell’alta dirigenza, quindi lo stipendio medio potrebbe dare un’idea migliore di quanto viene pagato un dipendente tipico. Se i dati vengono scomposti per titoli di studio, si potrebbe rilevare che la maggior parte dei dipendenti ha un titolo di studio universitario: questa sarebbe la modalità.