Was ist ein Histogramm?

In der Statistik ist ein Histogramm eine Art von Diagramm, das die Verteilung der Datenhäufigkeit anzeigt, normalerweise in Form von vertikalen Balken. Diese Art von Diagramm wird im Allgemeinen auch als Häufigkeitshistogramm und manchmal als Balkendiagramm oder Balkendiagramm bezeichnet. In einem Histogrammdiagramm zeigt die Höhe jedes Balkens die Anzahl der Elemente an, die im Diagramm in diesen Bereich fallen. Histogrammverteilungsdiagramme werden oft als das wichtigste Werkzeug bei der Untersuchung der Datenverteilung angesehen.

Das Histogrammdiagramm wird im Allgemeinen mit der Häufigkeit der Datenwerte auf der vertikalen Y-Achse des Diagramms und den verschiedenen Arten oder Kategorien von Daten entlang der horizontalen X-Achse des Diagramms angezeigt. Neben der Angabe, wie oft ein bestimmter Wert in einem Datensatz vorkommt, können mithilfe der statistischen Analyse der Histogrammdaten einige andere Informationen gewonnen werden. Dazu gehört auch die „Form“ der Daten, beispielsweise eine „flache“ Verteilung oder eine „glockenförmige“ Verteilung.

Ein Pareto-Diagramm ist eine spezielle Art von Histogramm, bei dem die Balken nach Größe geordnet sind, wobei der höchste Balken ganz links im Diagramm und der kleinste rechts angezeigt wird. Diese Pareto-Diagramme werden häufig in Qualitätskontrollprojekten verwendet, um die häufigsten Produktfehler in Fertigungssystemen hervorzuheben. Ihren Namen verdanken sie dem „Pareto-Prinzip“, das besagt, dass 20 % der Inputs für den Herstellungsprozess 80 % der Fehler verursachen.

Einige Beispiele von Mustern, die in Histogrammen erfasst werden können, umfassen Einzelpeak- und Dual-Peak-Muster. Ein einzelner Peak in den Daten ist auch der statistische Mittelwert für die Daten. Wenn sich der statistische Mittelwert nicht in der Mitte des Diagramms befindet, kann dies auf einen besonderen Grund hinweisen, der für eine Untersuchung nützlich sein könnte.

Ein Dual-Peak-Muster tritt auf, wenn zwei sehr hohe Balken im Diagramm vorhanden sind. Wenn dieses Muster angezeigt wird, kann dies darauf hinweisen, dass es zwei verschiedene Datenquellen gibt. In einer Produktionslinie können die Spitzen beispielsweise auf zwei einzelne Bediener zurückzuführen sein.

Die Histogramm-Entzerrung ist eine Methode, die bei der Bildbearbeitung verwendet wird, wie z. B. Software für digitale Fotografie. Es ermittelt anhand von Histogrammen, welche Intensitätsstufen im Bild am häufigsten vorkommen, und verteilt diese dann effizienter. Auf diese Weise kann der Gesamtkontrast des Bildes für eine bessere Betrachtung verbessert werden.