Was ist die Histogrammdarstellung?

Die Histogrammdarstellung in der Statistik ist die Verwendung eines Diagramms, um die Wahrscheinlichkeitsverteilung darzustellen und die Normalwerte dieser Verteilung mit einer gegebenen Variablen zu schätzen. Diese Darstellung erfolgt im Balkendiagrammformat, und die Informationen können normalisiert werden, um Datenerfassungsfehler zu berücksichtigen. Das Histogramm ist normalerweise so organisiert, dass die Häufigkeit der Variablen links und die Variable unten angezeigt wird. Das manuelle Erstellen eines Histogramms ist im Allgemeinen einfach, es sei denn, es werden große Datenmengen erfasst. In diesem Fall können mathematische und Tabellenkalkulationsprogramme die Daten in ein Histogramm umwandeln. Wenn das Histogramm erstellt wird, können mehrere Balken gleich groß sein; Wenn dies geschieht, werden die Balken verbunden.

Jedes Histogramm wird als Balkendiagramm erstellt und dient dazu, abzuschätzen, wie oft eine Variable auftritt. Während bei der Darstellung von Histogrammen immer wieder der gleiche Grafikstil verwendet wird, kann ein Histogramm für viele verschiedene Kategorien verwendet werden, z. B. Gebäudehöhe, Flugzeugankünfte pro Minute oder die Anzahl verschiedener Stühle in einem Möbelgeschäft oder Lager. Neben der Anzeige der Häufigkeit einer Variablen wird ein Histogramm üblicherweise mit einem Algorithmus normalisiert. Bei der Normalisierung werden die Daten gemäß dem Algorithmus geändert, um potenzielle Fehler bei der Informationssammlung zu berücksichtigen, und tendiert dazu, das Diagramm realistischer zu machen.

Neben der Verwendung eines Balkendiagramms organisiert das Histogramm-Plot das Diagramm auf eine standardmäßige Weise. Auf der linken Seite des Histogramms, oft als Häufigkeit bezeichnet, kann der Benutzer überprüfen, wie oft die Variable aufgetreten ist. Der untere Teil des Histogramms zeigt die Variable selbst an. Wenn die Variable beispielsweise die Gebäudehöhe ist, zeigt der untere Abschnitt unterschiedliche Höhenangaben an, und die Balken würden aufsteigen, je nachdem, wie viele Gebäude während der Datenerfassung gefunden wurden.

Das Erstellen von Histogrammen mit einer kleinen Datenmenge ist einfach und kann manuell durchgeführt werden. Dies wird jedoch schwierig, wenn Hunderte oder Tausende von Datensätzen erfasst werden. Dies führt dazu, dass die meisten Histogramme von Mathematik- und Tabellenkalkulationsprogrammen erstellt werden. Diese Programme nehmen die Daten und ordnen sie automatisch in einem Histogramm an.

Wenn ein Histogramm erstellt wird, haben die meisten benachbarten Balken nicht die gleiche Höhe, da die Häufigkeit für die Variable unterschiedlich ist. Wenn die Frequenz für mehrere Balken hintereinander gleich ist, werden diese Balken normalerweise verbunden und zu einem sehr breiten Balken gemacht. Dies erleichtert die Betrachtung des Histogramms und die Erstellung, insbesondere wenn der breite Balken einen großen Bereich des Histogramms umfasst.