Was ist eine kategoriale Variable?

Eine kategoriale Variable, die auch als nominale Variable bezeichnet wird, ist ein Variablentyp, dem zwei oder mehr Gruppen oder Kategorien zugewiesen werden können. Die Kategorien, denen eine Variable zugewiesen werden kann, haben keine Reihenfolge. Mit anderen Worten, die Kategorien können nicht von der höchsten zur niedrigsten geordnet werden. Ein Beispiel für eine kategoriale Variable ist Rasse, die viele verschiedene Kategorien hat, aber es gibt keine Reihenfolge für sie.

Eine Möglichkeit, den Variablentyp zu bestimmen, besteht darin, ob er quantitativ oder qualitativ ist. Eine quantitative Variable kann gemessen werden und hat einen bestimmten numerischen Wert. Beispiele für quantitative Variablen sind Größe, Gewicht, Alter, Gehalt, Temperatur usw. Alle Variablen, die nicht quantitativ sind, sind qualitativ oder eine kategoriale Variable. Diese Arten von Variablen haben keine numerische Bedeutung, wenn sie gemessen oder beobachtet werden, und umfassen Dinge wie Haarfarbe, Augenfarbe, Geschlecht, Geburtsort usw.

Kategoriale Variablen ähneln ordinalen Variablen, da sie beide spezifische Kategorien haben, die sie beschreiben. Der Unterschied zwischen einer kategorialen Variablen und einer ordinalen Variablen besteht darin, dass letztere eine intrinsische Ordnung hat. Beispielsweise kann eine Umfrage von den Befragten verlangen, Aussagen als schlecht, gut und ausgezeichnet einzustufen. Dies sind kategoriale Variablen, aber es gibt eine offensichtliche Reihenfolge, sodass es sich tatsächlich um ordinale Variablen handelt.

Datentabellen werden normalerweise verwendet, um kategorial gruppierte Daten zu analysieren. Mit einer Zweiwege-Datentabelle können zwei kategoriale Variablen gemessen und verglichen werden. Beispielsweise könnten Haarfarbe und Geschlecht für eine Gruppe von Personen gemessen werden. Die kategorialen Variablen, die beobachtet und aufgezeichnet würden, wären, ob die Person männlich oder weiblich ist und welche Haarfarbe sie hat. In der Tabelle wird die Anzahl der Beobachtungen für jede Gruppe für die beiden Variablen basierend auf den gesammelten Daten in Zeilen und Spalten eingetragen.

Balkendiagramme werden häufig als grafische Methode zur Analyse kategorialer variabler Daten verwendet. Die beobachteten Daten können als Rohzahlen oder als Prozentwerte eingegeben werden, was bevorzugt wird. Mit einem Balkendiagramm wird die Summe für jede Gruppe angezeigt.
Im obigen Beispiel könnte das Balkendiagramm die Anzahl der Männer oder Frauen oder die Anzahl der Individuen innerhalb jeder Haarfarbenkategorie darstellen. Ein segmentiertes Balkendiagramm kann eine Methode darstellen, um die während der Beobachtungen erfassten Zahlen anstelle einer geraden Summe für jede Gruppe anzuzeigen. Unter Verwendung der gleichen Haarfarbe und Geschlechtsdaten könnte ein segmentiertes Balkendiagramm zeigen, wie viele Männer und Frauen jeder Haarfarbe beobachtet wurden.