Was ist Freiheitsgrad?

Freiheitsgrad (df) ist ein Konzept, das in der Statistik und Physik am häufigsten verwendet wird. In beiden Fällen tendiert es dazu, Grenzen eines Systems und Position oder Größe des Analysierten zu definieren, damit es visuell dargestellt werden kann. Die Definition von df in beiden Feldern ist verwandt, aber nicht ganz gleich.

In der Physik positioniert der Freiheitsgrad Objekte oder Systeme, und jeder Grad bezieht sich auf eine Position in Zeit, Raum oder in anderen Messungen. Df könnte synonym mit dem Begriff Koordinate verwendet werden und bedeutet normalerweise unabhängige Koordinaten der kleinsten Zahl. Der tatsächliche Freiheitsgrad beruht darauf, dass das System im Phasenraum oder in allen möglichen Raumtypen, die ein System gleichzeitig bewohnt, beschrieben wird. Jeder einzelne Teil des Phasenraums, den das System einnimmt, kann als df betrachtet werden, was hilft, die vollständigen Realitäten des betrachteten Systems zu definieren.

Aus statistischer Sicht definiert der Freiheitsgrad Verteilungen von Populationen oder Stichproben und wird angetroffen, wenn Leute anfangen, Inferenzstatistiken zu studieren: Hypothesentests und Konfidenzintervalle. Wie bei der wissenschaftlichen Definition beschreibt df in der Statistik die Form oder Aspekte einer Stichprobe oder Population in Abhängigkeit von den Daten. Nicht alle gezeichneten Darstellungen von Verteilungen haben eine Freiheitsgradmessung. Die gemeinsame Standardnormalverteilung ist nicht durch Grade definiert; stattdessen wird es in allen Fällen dieselbe glockenförmige Kurve sein.

Eine ähnliche Verteilung wie die Standardnormale ist student-t. Das student-t wird teilweise durch den Freiheitsgrad in der Formel n-1 definiert, wobei n die Stichprobengröße ist. Dies bedeutet, dass nacheinander Variablen aus der Verteilung ausgewählt werden konnten, bis auf die letzte jedoch alle frei gewählt werden konnten. Es gibt keine andere Wahl, als die allerletzte Variable zu nehmen und keine Freiheit, an diesem Punkt eine andere Variable zu wählen. Daher ist eine Variable nicht frei; es ist, als müsste man während eines Scrabble®-Spiels, bei dem es keine andere Wahl gibt, als diesen Buchstaben zu wählen, das letzte Plättchen aus einem Beutel nehmen.

Unterschiedliche Verteilungen wie das F und das Chi-Quadrat haben unterschiedliche Definitionen des Freiheitsgrads, und einige verwenden sogar mehr als ein df in der Definition. Das Problem wird verwirrend, da die df-Definition mit der Art des durchgeführten Tests verknüpft ist und nicht mit den verschiedenen parametrischen (auf Parametern basierenden) und nicht parametrischen (nicht auf Parametern basierenden) Tests identisch ist. Im Wesentlichen wird es nicht immer n-1 sein. Anpassungsgüte- oder Kontingenztabellen-Tests können die Chi-Quadrat-Verteilung mit einem anderen df als dem verwenden, der das Testen der Varianz oder Standardabweichung von Einzelvariablen-Hypothesen auswertet.

Es ist wichtig, sich daran zu erinnern, dass jedes Mal, wenn ein Freiheitsgrad verwendet wird, um eine Verteilung zu definieren, diese diese ändert. Es kann immer noch bestimmte Eigenschaften haben, die sich nicht ändern, aber Größe und Aussehen variieren. Wenn Benutzer Darstellungen von Verteilungen zeichnen, insbesondere zwei gleiche Verteilungen mit unterschiedlichem df, wird empfohlen, sie in der Größe unterschiedlich aussehen zu lassen, um zu vermitteln, dass df nicht gleich ist.