¿Cuál es la diferencia entre causa y correlación?

Causa y correlación son términos que a menudo se confunden o se usan incorrectamente. Una correlación significa una relación entre dos o más cosas: cuando una aumenta, la otra aumenta, o cuando una aumenta, la otra disminuye. Una causa es algo que resulta en un efecto; por ejemplo, calentar el agua a cierta temperatura hará que hierva. El punto crucial es que una correlación entre dos cosas no significa necesariamente que una cause la otra. Si existe una relación entre dos fenómenos, A y B, podría ser que A cause B, o podría ser que B sea responsable de A; otras posibilidades son que algún otro factor sea la razón de A y B, o que tengan causas independientes que simplemente se ejecutan en paralelo.

La correlación

Los investigadores que intentan encontrar las razones de varias cosas a menudo utilizarán métodos estadísticos para establecer correlaciones: este puede ser el primer paso para establecer la causa. Los científicos y los estadísticos pueden usar una fórmula para determinar la fuerza de una relación entre dos fenómenos. Esto da una figura, conocida como el cuadrado del coeficiente de correlación, o R2, que siempre se encuentra entre 0 y 1, con un valor más cercano a 1 que indica una correlación más fuerte.

Cuando el valor de R2 es alto, esta relación puede merecer una mayor investigación; sin embargo, los investigadores deben tener cuidado de no sacar conclusiones precipitadas. Es posible identificar todo tipo de correlaciones fuertes, pero sin sentido. En un ejemplo muy conocido, el R2 para el número de muertes en carreteras en los EE. UU. Entre 1996 y 2000, y la cantidad de limones importados de México durante el mismo período, es 0.97 – una correlación muy fuerte – pero es extremadamente improbable que uno causa el otro.

Una correlación, particularmente cuando se informa en los medios de comunicación, a menudo se describe como un «vínculo», lo que puede ser engañoso, ya que puede interpretarse que significa que uno de los factores causa el otro. Por ejemplo, un estudio que descubrió que los hombres que bebían cuatro tazas de té verde al día tenían un riesgo menor de sufrir un derrame cerebral que los que no lo bebían podría generar el título «El té verde reduce el riesgo de sufrir un derrame cerebral». Esto implica que beber té verde reducirá directamente el riesgo de accidente cerebrovascular, pero el estudio no lo prueba. Otros factores, como el hecho de que el estudio se realizó en hombres en Japón que tienen dietas y hábitos de ejercicio diferentes a los de los hombres en los países occidentales, podrían haber influido en los resultados. Si bien aquí podría haber una relación causal más directa, se necesitaría un estudio más amplio y se necesitarían considerar más variables.

Causar
Si el factor A es responsable del factor B, habrá una fuerte correlación entre los dos, pero no necesariamente al revés. Demostrar más allá de toda duda razonable que A es responsable de B requiere mucho más que un alto valor de R2. Una vez establecida una relación sólida, los investigadores deberán proponer ideas sobre cómo A podría afectar a B y luego probar estas ideas mediante experimentos. A menudo ocurre que se puede identificar más de una posible causa. En estos casos, un buen método es realizar experimentos en los que todos menos uno de los factores permanezcan constantes, y luego determinar a partir de esto el factor responsable del efecto.

Por ejemplo, una planta que crece en un clima templado puede estar inactiva durante el invierno y comenzar a crecer en primavera. Una teoría sería que el aumento de las temperaturas medias desencadena el crecimiento, mientras que otra podría ser que los responsables son períodos más prolongados de luz solar. Para determinar cuál es el caso, una muestra de plantas puede estar sujeta a temperaturas crecientes y horas de luz constante, mientras que otra puede experimentar una temperatura constante y un aumento de la luz del día. Entonces se podría determinar la causa a partir de qué conjunto de plantas comienza a crecer. Si ninguno de los conjuntos comienza a crecer, se podría realizar un tercer experimento, en el que se aumentan tanto la temperatura como la luz del día; si esto da como resultado un crecimiento, entonces los investigadores podrían concluir que se requiere una combinación de ambos factores.
En algunos casos, una causa dada siempre resultará en un efecto particular; por ejemplo, la gravedad de la Tierra siempre hará que un objeto caiga si ninguna otra fuerza actúa sobre él. En otros casos, sin embargo, el efecto no está garantizado. Se sabe que la radiación ionizante y ciertas sustancias químicas son causas de cáncer, pero no todas las personas expuestas a estos factores desarrollarán la enfermedad, ya que hay un elemento de azar involucrado. Ambos factores pueden alterar el ADN y, a veces, esto hará que una célula se vuelva cancerosa, pero esto no sucederá siempre.
Sin embargo, si se trazaran los niveles de exposición a estos factores frente a la incidencia de cáncer en una muestra grande de personas similares, se esperaría una fuerte correlación.

Aunque los investigadores tienen criterios para buscar las posibles causas de un fenómeno en función de la fuerza de las correlaciones, el factor con el valor de R2 más alto no es necesariamente el responsable. Los científicos e investigadores rechazarán los factores que muestren una correlación débil, pero, como se señaló, los factores completamente irrelevantes pueden producir un R2 muy alto, al igual que los factores que aparecen por la misma razón que la cosa que se investiga. Por lo tanto, la probabilidad de que A cause B no es necesariamente proporcional a la fuerza de la correlación.
Confusión de causa y correlación
Mucha confusión entre causa y correlación resulta de la forma en que se informan los hallazgos en los medios. Una relación puede describirse como una «causa»; se puede informar que los videojuegos violentos provocan un comportamiento violento, cuando todo lo que se ha encontrado es una correlación, por ejemplo. Puede ser que las personas agresivas sean más propensas a jugar juegos violentos, por lo que estas personas se comportarían de manera más agresiva con o sin la influencia de los juegos.

Las investigaciones han demostrado que los juegos violentos pueden influir en la agresión. También muestra que una serie de otros factores pueden ser responsables del comportamiento violento, entre ellos, un nivel socioeconómico más pobre, enfermedades mentales, infancias abusivas y mala crianza de los hijos. Posiblemente, tales juegos pueden aumentar la probabilidad de un comportamiento violento en un individuo con una predisposición a la agresión resultante de otros factores, pero afirmar que los videojuegos violentos causan un comportamiento violento no está justificado por los hechos conocidos.
La salud es otra área donde puede surgir confusión. Aquellos que leen o escuchan acerca de las muchas cosas que, según se ha informado, causan o están relacionadas con el cáncer, es posible que nunca vuelvan a comer, beber o dejar sus hogares. Una «causa» puede ser solo una correlación, y un «vínculo» es solo eso: no identifica una causa definitiva del cáncer. Se está llevando a cabo una gran cantidad de investigación sobre las razones por las que se desarrolla el cáncer, y los científicos con frecuencia encuentran vínculos, pero cuando estos se informan en los medios de comunicación, la gente debe buscar o escuchar con atención las palabras calificativas como «puede», «podría aumentar» o «Podría tener un efecto», antes de sacar conclusiones.