Was ist eine Abweichung?

Die Varianz ist wie die Spannweite eine Statistik, die sich auf die Streuung einer bestimmten Stichprobe oder Grundgesamtheit bezieht. Sie wird für eine gegebene Grundgesamtheit berechnet, indem die Quadrate der Differenz zwischen jedem Element und dem Durchschnitt summiert und dann diese Summe durch die Anzahl der Elemente in der Grundgesamtheit geteilt wird. Je enger eine Population um den Mittelwert gruppiert ist, desto geringer ist die Varianz.

Eine eng verwandte Statistik ist die Standardabweichung, die die Quadratwurzel der Varianz ist. Die Standardabweichung wird häufiger in deskriptiven Statistiken verwendet, da sie intuitiver ist und dieselben Einheiten wie der Mittelwert verwendet. In der Normalverteilung, der klassischen glockenförmigen Verteilungskurve, die vielen Phänomenen gemein ist, liegen etwas mehr als 95 Prozent der Bevölkerung innerhalb von zwei Standardabweichungen vom Mittelwert.

Varianz ist am nützlichsten für prädiktive statistische Techniken wie Regression oder Varianzanalyse (ANOVA). Die Regression modelliert eine Variable als Summe eines oder mehrerer Faktoren, die die Variable und die Varianz beeinflussen, die die Differenz zwischen den tatsächlich beobachteten Elementen und ihren erwarteten Werten darstellt. Zum Beispiel könnte die Baubeschäftigung in einer Stadt als Basisniveau modelliert werden, plus eine jahreszeitliche Anpassung plus eine Anpassung für die Volkswirtschaft plus die Varianz. Regressionstechniken versuchen, ein Modell mit der kleinsten Varianz zu bestimmen, so dass der Erwartungswert der Vorhersage hoffentlich nahe dem beobachteten Wert liegt, nachdem die Beobachtung möglich ist.

ANOVA, die häufig in klinischen Studien verwendet wird, ist eine statistische Technik zur Klassifizierung von Varianzquellen. Beobachtungen werden nach einem oder mehreren interessierenden Faktoren in einem Experiment kategorisiert. Techniken der kleinsten Quadrate werden verwendet, um die Varianz in Zufallsfehler, Faktoreffekte und Interaktionseffekte zu unterteilen, mit dem Ziel, den Einfluss zu bestimmen, den der Faktor oder die Faktoren auf die Variable haben. Beispielsweise könnte ein Unternehmen, das einen neuen Dünger testet, ein ANOVA-Experiment mit dem Ernteertrag als untersuchte Variable und den Faktoren verwenden, welcher Dünger verwendet wurde und wie viel Niederschlag die Pflanzen erhalten haben. Wie sich der neue Dünger im Vergleich zu anderen Düngemitteln auswirkt, wäre ein Faktoreffekt im Experiment; Wenn der neue Dünger seine Konkurrenten bei Normalregen, nicht aber bei Starkregen übertreffen würde, wäre dies ein Beispiel für einen Interaktionseffekt.