Quelle est la différence entre cause et corrélation?

Cause et corrélation sont des termes souvent confondus ou mal utilisés. Une corrélation signifie une relation entre deux ou plusieurs choses : lorsque l’une augmente, l’autre augmente, ou lorsque l’une augmente, l’autre diminue. Une cause est quelque chose qui aboutit à un effet ; par exemple, chauffer l’eau à une certaine température la fera bouillir. Le point crucial est qu’une corrélation entre deux choses ne signifie pas nécessairement que l’une provoque l’autre. S’il existe une relation entre deux phénomènes, A et B, il se pourrait que A cause B, ou il se pourrait que B soit responsable de A ; d’autres possibilités sont qu’un autre facteur soit la raison à la fois de A et de B, ou qu’ils aient des causes indépendantes qui se déroulent en parallèle.

Corrélation

Les chercheurs essayant de trouver des raisons pour diverses choses utiliseront souvent des méthodes statistiques pour établir des corrélations : cela peut être la première étape vers l’établissement de la cause. Les scientifiques et les statisticiens peuvent utiliser une formule pour déterminer la force d’une relation entre deux phénomènes. Cela donne un chiffre, appelé carré du coefficient de corrélation, ou R2, qui se situe toujours entre 0 et 1, avec une valeur plus proche de 1 indiquant une corrélation plus forte.

Lorsque la valeur R2 est élevée, cette relation peut mériter une enquête plus approfondie ; cependant, les chercheurs doivent se garder de sauter aux conclusions. Il est possible d’identifier toutes sortes de corrélations fortes, mais dénuées de sens. Dans un exemple très connu, le R2 pour le nombre de tués sur les routes aux États-Unis entre 1996 et 2000, et la quantité de citrons importés du Mexique au cours de la même période, est de 0.97 — une très forte corrélation — mais il est extrêmement improbable que l’un provoque l’autre.

Une corrélation, en particulier lorsqu’elle est rapportée dans les médias, est souvent décrite comme un lien, ce qui peut être trompeur, car cela peut être interprété comme signifiant que l’un des facteurs provoque l’autre. Par exemple, une étude qui a révélé que les hommes qui boivent quatre tasses de thé vert par jour avaient un risque plus faible d’AVC que ceux qui n’en buvaient pas pourrait générer le titre Le thé vert réduit le risque d’AVC. Cela implique que la consommation de thé vert réduira directement le risque d’accident vasculaire cérébral, mais cela n’est pas prouvé par l’étude. D’autres facteurs, comme le fait que l’étude a été menée sur des hommes au Japon qui ont des régimes alimentaires et des habitudes d’exercice différents de ceux des hommes des pays occidentaux, pourraient avoir influencé les résultats. Bien qu’il puisse y avoir une relation causale plus directe ici, une étude plus large serait nécessaire et davantage de variables devraient être prises en compte.

Causes
Si le facteur A est responsable du facteur B, il y aura une forte corrélation entre les deux, mais l’inverse n’est pas nécessairement le cas. Prouver au-delà de tout doute raisonnable que A est responsable de B nécessite bien plus qu’une valeur R2 élevée. Après avoir établi une relation solide, les chercheurs devront alors trouver des idées sur la façon dont A pourrait affecter B, puis tester ces idées par l’expérience. Il arrive souvent que plus d’une cause possible puisse être identifiée. Dans ces cas, une bonne méthode consiste à mener des expériences dans lesquelles tous les facteurs sauf un restent constants, puis à déterminer à partir de là le facteur responsable de l’effet.

Par exemple, une plante qui pousse dans un climat tempéré peut être en dormance pendant l’hiver et commencer à pousser au printemps. Une théorie serait que l’augmentation des températures moyennes déclenche la croissance, tandis qu’une autre pourrait être que des périodes plus longues de lumière du jour sont responsables. Pour déterminer ce qui est le cas, un échantillon de plantes peut être soumis à des températures croissantes et à des heures de lumière du jour constantes, tandis qu’un autre peut subir une température constante et une lumière du jour croissante. La cause pourrait alors être déterminée à partir de quel ensemble de plantes commence à pousser. Si aucun des deux ensembles ne commence à croître, une troisième expérience peut être effectuée, dans laquelle à la fois la température et la lumière du jour sont augmentées ; si cela entraîne une croissance, les chercheurs pourraient conclure qu’une combinaison des deux facteurs est nécessaire.
Dans certains cas, une cause donnée entraînera toujours un effet particulier ; par exemple, la gravité terrestre fera toujours tomber un objet si aucune autre force n’agit sur lui. Dans d’autres cas, cependant, l’effet n’est pas garanti. Il est connu que les rayonnements ionisants et certains produits chimiques sont des causes de cancer, mais toutes les personnes exposées à ces facteurs ne développeront pas la maladie, car il y a un élément de hasard. Les deux facteurs peuvent altérer l’ADN, ce qui peut parfois entraîner une cellule cancéreuse, mais cela ne se produira pas à chaque fois.
Si, cependant, on devait tracer les niveaux d’exposition à ces facteurs par rapport à l’incidence du cancer dans un large échantillon de personnes par ailleurs similaires, une forte corrélation serait attendue.

Bien que les chercheurs disposent de critères pour rechercher les causes possibles d’un phénomène en fonction de la force des corrélations, le facteur ayant la valeur R2 la plus élevée n’est pas nécessairement le responsable. Les scientifiques et les chercheurs rejetteront les facteurs qui montrent une faible corrélation, mais, comme indiqué, des facteurs totalement non pertinents peuvent produire un R2 très élevé, tout comme les facteurs qui apparaissent pour la même raison que la chose étudiée. La probabilité que A provoque B n’est donc pas nécessairement proportionnelle à la force de la corrélation.
Confusion de cause et corrélation
Beaucoup de confusion entre la cause et la corrélation résulte de la façon dont les résultats sont rapportés dans les médias. Une relation peut être décrite comme une «cause» – il peut être rapporté que les jeux vidéo violents provoquent un comportement violent, alors que tout ce qui a été trouvé est une corrélation, par exemple. Il se peut que les personnes agressives soient plus susceptibles de jouer à des jeux violents, de sorte que ces personnes se comporteraient de manière plus agressive avec ou sans l’influence des jeux.

La recherche a montré que les jeux violents peuvent influencer l’agressivité. Il montre également qu’un certain nombre d’autres facteurs peuvent être responsables d’un comportement violent, parmi lesquels un statut socio-économique plus faible, une maladie mentale, des enfances abusives et une mauvaise parentalité. Il est possible que de tels jeux augmentent la probabilité d’un comportement violent chez un individu ayant une prédisposition à l’agression résultant d’autres facteurs, mais affirmer que les jeux vidéo violents provoquent un comportement violent n’est pas justifié par les faits connus.
La santé est un autre domaine où la confusion peut survenir. Ceux qui lisent ou entendent parler des nombreuses choses qui ont été signalées comme étant à l’origine ou liées au cancer pourraient ne plus jamais manger, boire ou quitter leur domicile. Une cause peut n’être qu’une corrélation, et un lien n’est que cela : il n’identifie pas une cause précise de cancer. De nombreuses recherches sont en cours sur les raisons pour lesquelles le cancer se développe, et les scientifiques trouvent fréquemment des liens, mais lorsque ceux-ci sont rapportés dans les médias, les gens devraient regarder ou écouter attentivement les mots qualificatifs comme peut, pourrait augmenter ou pourrait avoir un effet, avant de tirer des conclusions.