Was ist der zentrale Grenzwertsatz?

Der zentrale Grenzwertsatz der Statistik besagt, dass die Summe oder der Mittelwert einer großen Anzahl von Zufallsvariablen der Normalverteilung nähert. Es kann auch auf Binomialverteilungen angewendet werden. Je größer der Stichprobenumfang, desto näher liegt die Verteilung an der Normalverteilung.

Die Normalverteilung, an die sich der zentrale Grenzwertsatz annähert, hat die Form einer symmetrischen Glockenkurve. Normalverteilungen werden durch den Mittelwert, der durch den griechischen Buchstaben mu repräsentiert wird, und die Standardabweichung, repräsentiert durch Sigma, beschrieben. Der Mittelwert ist einfach der Durchschnitt und es ist der Punkt, an dem die Glockenkurve ihren Höhepunkt erreicht. Standardabweichungen geben an, wie gestreut die Variablen in der Verteilung sind – eine niedrigere Standardabweichung führt zu einer schmaleren Kurve.

Wie die Zufallsvariablen verteilt sind, spielt für den zentralen Grenzwertsatz keine Rolle – die Summe oder der Mittelwert der Variablen nähert sich immer noch einer Normalverteilung, wenn der Stichprobenumfang groß genug ist. Die Stichprobengröße der Zufallsvariablen ist wichtig, da Stichproben aus der Grundgesamtheit gezogen werden, um die Summe oder den Mittelwert zu erhalten. Sowohl die Anzahl der gezogenen Stichproben als auch der Umfang dieser Stichproben sind wichtig.

Um eine Summe aus einer aus Zufallsvariablen gezogenen Stichprobe zu berechnen, wird zunächst eine Stichprobengröße gewählt. Die Stichprobengröße kann nur zwei oder sehr groß sein. Es wird nach dem Zufallsprinzip gezogen und dann werden die Variablen in der Stichprobe addiert. Dieser Vorgang wird viele Male wiederholt und die Ergebnisse werden in einer statistischen Verteilungskurve grafisch dargestellt. Wenn die Anzahl der Stichproben und der Stichprobenumfang groß genug sind, liegt die Kurve sehr nahe an der Normalverteilung.

Stichproben werden für Mittelwerte im zentralen Grenzwertsatz genauso gezogen wie für Summen, aber anstatt zu addieren, wird der Durchschnitt jeder Stichprobe berechnet. Eine größere Stichprobengröße führt zu Ergebnissen, die näher an der Normalverteilung liegen, und führt normalerweise auch zu einer kleineren Standardabweichung. Bei den Summen ergibt eine größere Anzahl von Stichproben eine bessere Annäherung an die Normalverteilung.

Der zentrale Grenzwertsatz gilt auch für Binomialverteilungen. Binomialverteilungen werden für Ereignisse mit nur zwei möglichen Ergebnissen verwendet, wie z. B. das Werfen einer Münze. Diese Verteilungen werden durch die Anzahl der durchgeführten Versuche n und die Erfolgswahrscheinlichkeit p für jeden Versuch beschrieben. Mittelwert und Standardabweichung für eine Binomialverteilung werden mit n und p berechnet. Wenn n sehr groß ist, sind Mittelwert und Standardabweichung für die Binomialverteilung die gleichen wie für die Normalverteilung.