Heteroskedastizität ist ein statistischer Begriff, der verwendet wird, um das Verhalten der Varianz und Standardabweichung einer Stichprobe zu beschreiben. Wenn die Qualität vorhanden ist, sind Varianz und Standardabweichung der Variablen über den gesamten Graphen der Stichprobendaten nicht konstant. Sind diese Maße konstant, spricht man von homoskedastischen Daten.
Die Varianz einer Variablen ist ein Maß dafür, wie weit die beobachteten Werte vom Mittelwert oder Durchschnittswert abweichen. Die Standardabweichung ist die Quadratwurzel der Varianz und wird oft verwendet, um Verteilungen zu beschreiben. Gemäß der durch den Satz von Chebyshev beschriebenen Beziehung muss ein bestimmter Prozentsatz der Daten innerhalb jeder Standardabweichung vom Mittelwert liegen. Beispielsweise müssen mindestens 75 Prozent der Datenpunkte in einer Stichprobe innerhalb von zwei Standardabweichungen vom Mittelwert liegen. Somit gibt die Standardabweichung einer Stichprobe grobe Informationen über die relative Position jedes Datenpunkts.
Es gibt zwei Arten von Heteroskedastizität: bedingte und unbedingte. Wenn Daten bedingt heteroskedastisch sind, können Analysten nicht vorhersagen, wann die Daten stärker und wann weniger gestreut sein werden. Dies ist bei den Preisen von Finanzprodukten, einschließlich Aktien, der Fall.
Bedingungslose Heteroskedastizität ist vorhersehbar. Variablen, die von Natur aus zyklisch sind, weisen diese Eigenschaft häufig auf. Variablen, deren Varianz sich mit ihrem Niveau ändert, sind ebenfalls unbedingt hetroskedastisch. Sie können beispielsweise vorhersagen, dass Sie, wenn Sie etwas in der Hand halten können, sein Gewicht ziemlich genau abschätzen können; Sie könnten höchstens ein paar Pfund oder Kilogramm davon entfernt sein. Wenn Sie jedoch aufgefordert werden, das Gewicht eines Gebäudes zu schätzen, liegen Sie möglicherweise um Tausende von Pfund oder Kilogramm falsch – die Varianz Ihrer Schätzung nimmt vorhersehbar mit dem Gewicht des Objekts zu.
Ob Heteroskedastizität vorliegt oder nicht, hat Einfluss auf die richtige Interpretation der statistischen Analyse der Daten. Die Qualität hat keinen Einfluss auf die Regression; Dies bedeutet, dass Methoden zum Platzieren von Best-Fit-Graphen mit heteroskedastischen und homoskedastischen Daten gleichermaßen gut funktionieren. Diese Diagramme werden erstellt, indem die Datenkoeffizienten ermittelt werden, die messen, wie stark eine bestimmte Variable ein Ergebnis beeinflusst. Heteroskedastizität verzerrt die Werte der Varianz der Koeffizienten, die die Modelle zurückgeben.
Es gibt eine Vielzahl von mathematischen Tests, mit denen festgestellt werden kann, ob eine Stichprobe einer Variablen Heteroskedastizität aufweist. Viele dieser Tests sind in Statistikanalysesoftware verfügbar. Ein Beobachter kann auch einige Fälle von Heteroskedastizität erkennen, indem er einen Graphen der Stichprobe betrachtet. Suchen Sie nach Bereichen des Diagramms, die mehr oder weniger verstreut sind; Es ist jedoch wichtig, zwischen echten Variationen im Streuungsbetrag und den Clustern zu unterscheiden, die in Verteilungen mit einem Zufallselement erwartet werden.