Che cos’è un coefficiente di determinazione?

Il coefficiente di determinazione è un calcolo matematico del quadrato di un coefficiente di correlazione. Il coefficiente di correlazione è un calcolo dell’accuratezza di un modello. Questi termini sono usati nell’analisi statistica per spiegare calcoli abbastanza logici.

Nelle statistiche, il compito di un analista è esaminare i dati raccolti da uno scenario o un evento specifico e creare un modello matematico che spieghi i dati. Per creare questo modello, ci sono alcuni fatti che devono essere presi in considerazione.

C’è una possibilità di errore in ogni calcolo e raccolta di dati. Poiché questo è coerente, il tasso di errore deve essere incorporato nel modello. Tenendo conto di questo errore, cessa di essere rilevante per determinare se il modello proposto fornisce una solida spiegazione per i dati.

L’effettivo calcolo del coefficiente di determinazione è

R2 = Somma degli errori al quadrato

Somma degli errori al quadrato + Somma dei quadrati di regressione

Questo è un calcolo dell’accuratezza del modello nella spiegazione dei dati.

Utilizzato nell’analisi statistica, questo valore fornisce informazioni sulla “bontà di adattamento” del modello statistico ai dati. Il valore del coefficiente è compreso tra 0 e 1. Un adattamento perfetto del modello per spiegare la variazione è 1 e 0 è il valore quando il modello non spiega affatto la variazione.

Il coefficiente di determinazione tiene conto degli errori con i dati, o valori anomali, e della somma dei quadrati di regressione. Non esiste un’unità per questo valore, poiché è essenzialmente un rapporto ed è completamente estraneo alla dimensione del campione. Maggiore è il valore, prossimo a 1, migliore è la spiegazione della variazione fornita dal modello.

Un modo semplice per visualizzare questo concetto è creare un grafico di tutti i dati che circondano un particolare evento. Disponi tre vassoi di biscotti in una sala da pranzo, cioccolato, mandorle e arachidi. Osserva come le persone entrano nella sala da pranzo e annota quanti biscotti prendono, di che tipo e in quale ordine. Traccia questi dati su un grafico.

Crea una formula attorno al comportamento previsto. Un esempio potrebbe essere quello di prevedere che ogni persona che ha preso 1 biscotto al cioccolato, ha preso anche 2 mandorle, ma nessuna nocciolina. Una semplice equazione lineare può essere scritta sulla base di questo presupposto e rappresentata graficamente.

Traccia la linea che rappresenta l’equazione lineare di quella previsione. Confronta la linea con l’effettiva raccolta di dati nella tua osservazione. Calcolare il coefficiente di determinazione per fornire una misura dell’accuratezza del comportamento previsto rispetto ai dati effettivi.

Il coefficiente di determinazione indica la quantità di diffusione dei dati attorno alla linea. Mostra quanto sia stata buona o cattiva la previsione, rispetto ai valori effettivi. Il coefficiente di determinazione consente agli utenti di applicare un “controllo di realtà” ai dati proposti in un modello statistico. Esistono due valori, i valori osservati o effettivi e i valori modellati o previsti.

Questo tipo di analisi statistica è molto comune sia nella scienza che negli affari. Molte decisioni aziendali si basano su previsioni di comportamento futuro. È importante analizzare i risultati effettivi e confrontarli con le previsioni. Questo processo migliora il modello successivo e quindi l’accuratezza delle previsioni.

Smart Asset.