Was ist ein Boxplot?

Ein Boxplot oder Box-and-Whisker-Diagramm ist eine Methode zum Organisieren numerischer Daten entlang einer einzelnen Zahlenlinie, die entweder horizontal oder vertikal verlaufen kann. Die eigentliche Box befindet sich bei horizontaler Darstellung etwas über dem Zahlenstrahl und besteht aus drei vertikalen Linien, die durch horizontale Linien miteinander verbunden sind. Die horizontalen Grenzen der Box stellen das erste und dritte Quartil (25. und 75. Perzentil) dar, getrennt durch die Mittellinie, die den Median oder das 50. Perzentil der Daten darstellt. Auf beiden Seiten des Boxplots erstrecken sich von der Mitte der horizontalen Linien vertikale Linien, manchmal auch Whisker genannt. Wenn diese die minimale und maximale Anzahl des Datensatzes erreichen, enden sie in kleineren horizontalen Linien, obwohl dies je nach Datenverteilung leicht variieren kann.

Es gibt einige wichtige Elemente, die einen guten Boxplot ausmachen, und einige Zahlen, die die Leute kennen müssen, wenn sie diese Diagramme erstellen. Die erste davon wird als Fünf-Zahlen-Zusammenfassung bezeichnet, die oft als Fünf-Zahl abgekürzt wird. Summe. Dies ist eine Auflistung des ersten und dritten Quartils, des Medians sowie der Mindest- und Höchstzahlen der Daten. In einigen Anwendungen müssen die Benutzer diese in der Nähe des Diagramms auflisten, obwohl die Analyse eines Diagramms mit einer guten Zahlenlinie diese Zahlen auch durch Betrachten der drei horizontalen Linien und der Endschnurrhaare ableiten kann. Es ist keine Henne-Ei-Frage für die Person, die eine Handlung zeichnet, weil die fünf num. Summe. muss zum Erstellen des Plots verwendet werden.

Die Leute müssen auch eine Zahl kennen, die als Interquartilsabstand (IQR) bezeichnet wird. Das Subtrahieren des ersten Quartils vom dritten Quartil ergibt den IQR, und die Verwendung verschiedener Software oder wissenschaftlicher Taschenrechner kann auch diese Zahl und die Fünf-Zahlen-Zusammenfassung durch Eingabe aller Daten erhalten. Der IQR ist wichtig, da Linien, die von der Box ausgehen, normalerweise nur bis zum 1.5-fachen des IQR reichen. Daten über diesen Punkt hinaus werden durch Punkte anstelle einer durchgehenden Linie angezeigt. Diese Punkte weisen oft darauf hin, dass die Daten Ausreißer aufweisen.

Für den Boxplot gibt es eine Vielzahl von Verwendungsmöglichkeiten. Mehrere Diagramme können über einer Zahlenlinie gezeichnet werden und können ähnliche Datensätze vergleichen, die durch einen wichtigen Faktor unterschieden werden. Wissenschaftler oder Statistiker können beispielsweise die Herzfrequenz von Männern und Frauen aufzeichnen und dann zwei gestapelte Boxplots erstellen, um nach signifikanten Unterschieden in Reichweite und Quartilen zu suchen.

Boxplots befassen sich nicht mit der Datenhäufigkeit. Das Fehlen einer zusätzlichen Skala (vertikal oder horizontal) lässt Informationen über sich wiederholende Zahlen, die Datensatzgröße und die meisten einzelnen Zahlen aus. Die Person, die sich einen Boxplot ansieht, wird die fünf Zahlenzusammenfassung, den Bereich und ob die Daten Ausreißer aufweisen, am besten verstehen. Die Boxgröße, das Verhältnis von Median zu Quartilen und Länge der Whisker können anzeigen, ob die Daten verzerrt sind, aber sie können nicht auf Dinge wie Mittelwert, Modus oder Standardabweichung hinweisen. Andere Diagramme wie Histogramme können nützlicher sein, wenn Benutzer Dinge wie die Häufigkeit darstellen oder eine bessere Visualisierung der Datenverteilung ableiten möchten.