En statistique, la moyenne et la médiane sont des mesures différentes de la tendance centrale dans un ensemble de données, ou de la tendance des nombres à se regrouper autour d’une valeur particulière. Dans un groupe de valeurs, il peut être souhaitable de trouver celle qui est la plus typique. Une façon de le faire est de trouver la moyenne, ou moyenne, qui est la somme de toutes les valeurs divisée par le nombre total de valeurs. Une autre façon consiste à trouver la valeur médiane, ou médiane, qui est celle au centre d’une liste ordonnée de nombres. La meilleure méthode à utiliser dépend de l’application et de la nature des données.
Médian
Obtenir la moyenne de quelque chose revient à obtenir le nombre moyen dans un ensemble de données. La somme des valeurs de l’ensemble est divisée par le nombre de valeurs. Par exemple, un enseignant peut évaluer cinq résultats de test, tous pondérés de manière égale, pour déterminer une note pour un élève. Si les cinq scores du test sont 80, 85, 60, 90 et 100, ces nombres sont additionnés pour donner une somme de 415, qui est divisée par 5 pour obtenir le score moyen de 83. Après avoir calculé cela, l’enseignant peut attribuer une note à l’élève.
Moyenne
Dans une mesure médiane, les données sont classées du plus bas au plus élevé : 60, 80, 85, 90 et 100. Le nombre du milieu dans cet ensemble est la médiane. Dans cet exemple, la médiane est 85, le troisième et le deuxième nombre de l’ensemble. Cela varie légèrement par rapport à la moyenne de 83. Un enseignant peut souhaiter examiner un score médian, car il tend à exclure un score anormalement bas, comme 60, qui abaisserait la moyenne.
Lorsque le nombre de valeurs est pair, une moyenne des deux nombres centraux est prise. Ces deux nombres sont additionnés et divisés par deux. Par exemple, dans une classe de dix élèves, les scores d’un test pourraient être, dans l’ordre croissant, de 48, 56, 57, 61, 65, 68, 68, 71, 77 et 82. La médiane de cet ensemble de données serait la moyenne des cinquième et sixième nombres, 65 et 68, soit 66.5.
Applications
Ces méthodes sont toutes deux utilisées pour trouver une valeur «typique» à partir d’un ensemble de données. La moyenne est la mesure de tendance centrale la plus couramment utilisée, mais il y a des cas où elle n’est pas appropriée. Par exemple, les données peuvent être biaisées, ce qui signifie que la plupart des nombres se situent soit vers le bas ou le haut de l’échelle, ou qu’il existe une valeur très différente de toutes les autres – c’est ce qu’on appelle un valeur aberrante. Surtout dans un petit ensemble de données, la valeur moyenne dans ces cas ne sera pas typique.
Par exemple, si cinq élèves passent un test et que les scores sont de 24, 85, 89, 91 et 95, le score moyen est de 60.6. Ceci, cependant, est atypique – la moyenne a été abaissée d’un score aberrant de 24, peut-être parce qu’un étudiant n’avait pas étudié. Dans ce cas, la médiane de 89 est beaucoup plus typique.
Une autre méthode occasionnellement utilisée est le mode, qui est simplement la valeur la plus courante dans un ensemble de données. Il est parfois utilisé lorsque les valeurs possibles dans un ensemble de données sont limitées et mutuellement exclusives. Par exemple, une enquête auprès des propriétaires d’ordinateurs portables peut être réalisée pour trouver la marque la plus populaire. Dans ce cas, une marque moyenne ou médiane n’aurait pas de sens, et la marque la plus populaire serait le mode.
Pour donner un exemple où les trois méthodes pourraient être utilisées, certaines données relatives aux employés d’une entreprise pourraient être collectées. Une analyse peut calculer le salaire moyen, mais cela peut être faussé par un petit nombre de très hauts salaires dans la haute direction, de sorte que le salaire médian peut donner une meilleure idée de combien un employé type est payé. Si les données sont ventilées par niveau d’études, on pourrait constater que la majorité des employés ont un diplôme universitaire — ce serait le mode.