¿Qué es una variable categórica?

Una variable categórica, que también se conoce como variable nominal, es un tipo de variable que puede tener dos o más grupos o categorías que se pueden asignar. No hay ningún orden en las categorías a las que se puede asignar una variable. En otras palabras, las categorías no se pueden ordenar de mayor a menor. Un ejemplo de una variable categórica es raza, que tiene muchas categorías diferentes pero no hay ningún orden para ellas.

Una forma de determinar el tipo de variable es si es cuantitativa o cualitativa. Una variable cuantitativa se puede medir y tiene un valor numérico específico. Ejemplos de variables cuantitativas incluyen altura, peso, edad, salario, temperatura, etc. Cualquier variable que no sea cuantitativa es cualitativa o categórica. Estos tipos de variables no tienen un significado numérico cuando se miden u observan, e incluyen cosas como el color del cabello, el color de los ojos, el sexo, la ciudad de nacimiento, etc.

Las variables categóricas son similares a las variables ordinales ya que ambas tienen categorías específicas que las describen. La diferencia entre una variable categórica y una variable ordinal es que esta última tiene un orden intrínseco. Por ejemplo, una encuesta puede pedir a los encuestados que clasifiquen las declaraciones como malas, buenas y excelentes. Estas son variables categóricas, pero hay un orden obvio, por lo que de hecho son variables ordinales.

Las tablas de datos se utilizan generalmente para analizar datos que se agrupan categóricamente. Con una tabla de datos bidireccional, se pueden medir y comparar dos variables categóricas. Por ejemplo, el color y el sexo del cabello se pueden medir para un grupo de personas. Las variables categóricas que se observarían y registrarían serían si la persona es hombre o mujer y de qué color es su cabello. En la tabla, el número de observaciones de cada grupo para las dos variables se ingresaría en filas y columnas según los datos recopilados.

Los gráficos de barras se utilizan a menudo como un método gráfico para analizar datos de variables categóricas. Los datos que se observan se pueden ingresar como números brutos o como porcentajes, que son los preferidos. Con un gráfico de barras, se muestra el total de cada grupo.
En el ejemplo anterior, el gráfico de barras podría representar el número de hombres o mujeres o el número de individuos dentro de cada categoría de color de cabello. Un gráfico de barras segmentadas puede proporcionar un método para mostrar los números capturados durante las observaciones en lugar de un total directo para cada grupo. Usando el mismo color de cabello y datos de género, un gráfico de barras segmentado podría mostrar cuántos hombres y mujeres de cada color de cabello se observaron.