Das Bestimmtheitsmaß ist eine mathematische Berechnung des Quadrats eines Korrelationskoeffizienten. Der Korrelationskoeffizient ist eine Berechnung der Genauigkeit eines Modells. Diese Begriffe werden in der statistischen Analyse verwendet, um ziemlich logische Berechnungen zu erklären.
In der Statistik besteht die Aufgabe eines Analysten darin, die von einem bestimmten Szenario oder Ereignis gesammelten Daten zu betrachten und ein mathematisches Modell zu erstellen, das die Daten erklärt. Um dieses Modell zu erstellen, müssen einige Fakten berücksichtigt werden.
Bei jeder Berechnung und Erhebung von Daten besteht die Möglichkeit eines Fehlers. Da dies konsistent ist, muss die Fehlerrate in das Modell einfließen. Durch die Berücksichtigung dieses Fehlers ist es nicht mehr relevant zu bestimmen, ob das vorgeschlagene Modell eine solide Erklärung für die Daten liefert.
Die tatsächliche Bestimmtheitsmaßberechnung ist
R2 = Summe der quadrierten Fehler
Summe der quadrierten Fehler + Regressionssumme der Quadrate
Dies ist eine Berechnung der Genauigkeit des Modells bei der Erklärung der Daten.
Dieser Wert wird in der statistischen Analyse verwendet und bietet einen Einblick in die „Güte der Anpassung“ des statistischen Modells an die Daten. Der Wert des Koeffizienten liegt zwischen 0 und 1. Eine perfekte Anpassung des Modells zur Erklärung der Variation ist 1 und 0 ist der Wert, wenn das Modell die Variation überhaupt nicht erklärt.
Das Bestimmtheitsmaß berücksichtigt Datenfehler oder Ausreißer und die Regressionsquadratsumme. Für diesen Wert gibt es keine Einheit, da er im Wesentlichen ein Verhältnis ist und völlig unabhängig von der Größe der Stichprobe ist. Je höher der Wert, der sich 1 annähert, desto besser erklärt das Modell die Variation.
Eine einfache Möglichkeit, dieses Konzept zu visualisieren, besteht darin, ein Diagramm aller Daten zu einem bestimmten Ereignis zu erstellen. Stellen Sie drei Tabletts mit Keksen in einer Kantine bereit, Schokolade, Mandel und Erdnuss. Beobachten Sie, wie die Leute in die Kantine kommen und schreiben Sie auf, wie viele Kekse sie essen, welche Art und in welcher Reihenfolge. Tragen Sie diese Daten in ein Diagramm ein.
Erstellen Sie eine Formel um das vorhergesagte Verhalten. Ein Beispiel wäre die Vorhersage, dass jede Person, die 1 Schokoladenkeks nahm, auch 2 Mandeln, aber keine Erdnuss nahm. Basierend auf dieser Annahme kann eine einfache lineare Gleichung geschrieben und grafisch dargestellt werden.
Zeichnen Sie die Linie, die die lineare Gleichung dieser Vorhersage darstellt. Vergleichen Sie die Linie mit der tatsächlichen Datensammlung in Ihrer Beobachtung. Berechnen Sie das Bestimmtheitsmaß, um die Genauigkeit des vorhergesagten Verhaltens im Vergleich zu den tatsächlichen Daten zu messen.
Das Bestimmtheitsmaß gibt die Streuung der Daten um die Linie an. Es zeigt an, wie gut oder schlecht die Vorhersage im Vergleich zu den tatsächlichen Werten war. Das Bestimmtheitsmaß ermöglicht es den Nutzern, die in einem statistischen Modell vorgeschlagenen Daten einem „Realitätscheck“ zu unterziehen. Es gibt zwei Werte, die beobachteten oder tatsächlichen Werte und die modellierten oder vorhergesagten Werte.
Diese Art der statistischen Analyse ist in der Wissenschaft und in der Wirtschaft weit verbreitet. Viele Geschäftsentscheidungen basieren auf Vorhersagen des zukünftigen Verhaltens. Es ist wichtig, die tatsächlichen Ergebnisse zu analysieren und mit den Vorhersagen zu vergleichen. Dieser Prozess verbessert das nächste Modell und damit die Genauigkeit der Vorhersagen.