Qu’est-ce qu’une variable catégorielle ?

Une variable catégorielle, également appelée variable nominale, est un type de variable qui peut avoir deux ou plusieurs groupes, ou catégories, pouvant être affectés. Il n’y a pas d’ordre dans les catégories auxquelles une variable peut être affectée. En d’autres termes, les catégories ne peuvent pas être classées de la plus haute à la plus basse. Un exemple de variable catégorielle est la race, qui comporte de nombreuses catégories différentes mais sans ordre.

Une façon de déterminer le type de variable est de savoir si elle est quantitative ou qualitative. Une variable quantitative peut être mesurée et a une valeur numérique spécifique. Des exemples de variables quantitatives incluent la taille, le poids, l’âge, le salaire, la température, etc. Toutes les variables qui ne sont pas quantitatives sont qualitatives ou une variable catégorielle. Ces types de variables n’ont aucune signification numérique lorsqu’elles sont mesurées ou observées, et incluent des éléments tels que la couleur des cheveux, la couleur des yeux, le sexe, la ville de naissance, etc.

Les variables catégorielles sont similaires aux variables ordinales car elles ont toutes deux des catégories spécifiques qui les décrivent. La différence entre une variable catégorielle et une variable ordinale est que cette dernière a un ordre intrinsèque. Par exemple, un sondage peut demander aux répondants de classer les énoncés comme mauvais, bons et excellents. Ce sont des variables catégorielles, mais il y a un ordre évident, ce sont donc en fait des variables ordinales.

Les tableaux de données sont généralement utilisés pour analyser des données regroupées par catégorie. Avec un tableau de données à double entrée, deux variables catégorielles peuvent être mesurées et comparées. Par exemple, la couleur des cheveux et le sexe pourraient être mesurés pour un groupe d’individus. Les variables catégorielles qui seraient observées et enregistrées seraient si la personne est un homme ou une femme et de quelle couleur sont ses cheveux. Dans le tableau, le nombre d’observations pour chaque groupe pour les deux variables serait inscrit dans des lignes et des colonnes en fonction des données recueillies.

Les graphiques à barres sont souvent utilisés comme méthode graphique d’analyse des données de variables catégorielles. Les données observées peuvent être saisies sous forme de nombres bruts ou de pourcentages, ce qui est préférable. Avec un graphique à barres, le total pour chaque groupe est affiché.
Dans l’exemple ci-dessus, le graphique à barres pourrait représenter le nombre d’hommes ou de femmes ou le nombre d’individus dans chaque catégorie de couleur de cheveux. Un graphique à barres segmenté peut fournir une méthode pour montrer les nombres capturés pendant les observations au lieu d’un total simple pour chaque groupe. En utilisant les mêmes données sur la couleur des cheveux et le sexe, un graphique à barres segmenté pourrait montrer combien d’hommes et de femmes de chaque couleur de cheveux ont été observés.