Selecciona Edición
Entra en EL PAÍS
Conéctate ¿No estás registrado? Crea tu cuenta Suscríbete
Selecciona Edición
Tamaño letra

Ver películas de Nicolas Cage aumenta el riesgo de ahogarse en la piscina

Saber leer las estadísticas y entrenar el espíritu crítico servirá para no confundir casualidad con causalidad

Nicolas Cage

Un estudio afirma que los niños que duermen con la luz encendida tienen más posibilidades de padecer miopía. Otro vincula la cifra de ahogamientos en Estados Unidos con el número de películas realizadas por Nicolas Cage. De los dos ejemplos, ¿cuál le da más confianza? Muchos apuntarán a la de los niños y la miopía, mientras echan unas risas con la del actor americano. Si usted está entre ellos, acaba de caer en una trampa. Extraídas de dos estudios distintos, estas dos afirmaciones, basadas en la correlación de hechos inconexos, son igual de inválidas. La primera, publicada en un estudio de la revista Nature, y la segunda en Spurious correlations, un blog de estadísticas absurdas a cargo de un estudiante de Derecho de Harvard, llevan a la misma confusión: dar por hecho una relación de causa-efecto entre dos acontecimientos consecutivos.

La frase de “todo está interconectado”, típica del pensamiento mágico, encuentra su contestación en la no menos famosa “la correlación no implica causalidad”. Esta conocida sentencia, presente en toda buena clase de estadística y probabilidad, es propia del kit de pensamiento escéptico, para discernir cuándo una información o un dato son ciertos. Pero, aunque lo haya oído mil veces en latín, “post hoc ergo propter hoc”, o en inglés, “correlation is not a cause”, bajo las siglas CINAC, usted no puede evitar que en su día a día le cuelen informaciones como certeras cuando no lo son.

La clave, señala el matemático Miguel Ángel Morales, autor del blog Gaussianos, está en saber que una correlación fuerte entre dos variables no significa que una de ellas sea la causa de la otra, aunque en algún caso lo pueda ser. “No significa que si se encuentra una correlación entre dos variables debe descartarse que una sea causa de la otra. Hay casos en los que A es la causa de que ocurra B, en otros es al revés, en otros hay alguna variable adicional la que hace que se produzca, y a veces todo es fruto de la casualidad. El problema de creer que una fuerte correlación implica una cierta relación causal entre las variables es que extraigamos conclusiones equivocadas, que nos traguemos algún engaño o que le atribuyamos ciertas propiedades a algún producto que en realidad no tiene, ya que no es demasiado difícil encontrar este vínculo entre dos variables que en principio no están relacionadas”, matiza Morales.

“El problema de creer que una fuerte correlación implica una cierta relación causal es extraer conclusiones equivocadas, tragarnos un engaño o atribuir ciertas propiedades irreales a un producto”, Miguel Ángel Morales

Para llamar la atención sobre la fragilidad de creer en los datos sin una interpretación meditada, las estadísticas absurdas de Spurious Correlations, del analista en inteligencia militar Tyler Vigen, se ponen a su alcance para que usted mismo descubra el lado oscuro de la correlación, a base de variables dispares y disparatadas. Junto al ejemplo de los ahogamientos y las películas de Cage, otras correlaciones espurias no menos sorprendentes vinculan el consumo de queso con las personas que mueren estrangulas por las sábanas, el consumo de margarina con el número de divorcios en el Estado de Maine (EE UU) o los suicidios por ahorcamiento, estrangulamiento y asfixia con el gasto en ciencia, espacio y tecnología.

La razón de cometer el error no solo reside en que la mayoría de la gente carece de un adecuado entrenamiento en el razonamiento probabilístico y estadístico, señala David Ríos, director de la Cátedra AXA en Análisis de Riesgos Adversarios en el Instituto de Ciencias Matemáticas ICMAT-CSIC: “También puede deberse a un comportamiento no ético de quién nos da la información, motivado por intereses económicos (por ejemplo, que realicemos compras o inversiones), políticos (que conduzca a decisiones que puedan interesar a un grupo de presión) o científicos (por la presión de obtener conclusiones más llamativas que puedan ser publicadas en revistas científicas)”, ilustra.

Un estudio publicado en 2012 en la revista New England Journal of Medicine concluía que el consumo de chocolate mejoraba la función cognitiva, basándose en una fuerte correlación entre el número de premios Nobel de una nacionalidad y el consumo per cápita de chocolate en su país. Y aunque el artículo fuera criticado por la comunidad científica (entre otros motivos, porque los investigadores no conocían el consumo real de los laureados), la noticia del resultado no tardó en publicase en la prensa. “Confundir correlación y causalidad es uno de los errores habituales al procesar información sobre fenómenos de incertidumbre”, señala Ríos, quien añade: “Otros ejemplos serían el exceso de confianza sobre lo que en realidad sabemos, no considerar las tasas básicas al procesar información o confundir el concepto de probabilidades condicionadas (la probabilidad de un hecho A dado un hecho B)”.

Correlación versus causalidad, el juego de las diferencias

El error está en mezclar la ocurrencia simultánea (en el tiempo y/o en el lugar) de dos fenómenos, pensando que uno es causa del otro. Un ejemplo clásico y muy adecuado para estas fechas, recuerda Ríos, es suponer que el consumo de helados en verano en Denia esté altamente correlacionado con el número de ahogados, por ejemplo, en Benidorm, concluyendo que el consumo de helados cause los ahogamientos. “En realidad en este caso hay una tercera variable, la temperatura, que explica las oscilaciones en ambos factores: a mayor calor en Denia, mayor consumo de helados allí, pero también hará más calor en Benidorm y mayor cantidad de gente se meterá en el agua, por lo que, en consecuencia, más personas se ahogarán”, explica este experto.

"Creer en una relación causal irreal entre dos o más variables implica malgastar recursos inútilmente e, incluso, perjudicialmente”, David Ríos

Otro ejemplo famoso, en clave de humor, es la cita clásica que asegura que desde 1860 el descenso de piratas en el mundo ha provocado el calentamiento global. La sentencia, creada por el fundador de la iglesia pastafari, Bobby Henderson, como crítica al creacionismo, pone de manifiesto nuestro error habitual de confundir casualidad con causalidad, es decir, que aunque los números coincidan (el número de piratas decaiga a la que vez la temperatura de la atmósfera suba), no significa que una variable motive la otra.

El mejor antídoto para no dejarse llevar por las apariencias de los datos, se encuentra en detectar los matices íntimos que separan la correlación de la causalidad, es decir, saber leer las estadísticas. La correlación estudia la relación de fuerza o dependencia entre dos variables, que puede ser diferente en cada caso: las hay positivas, negativas, fuertes o débiles. Si una de las variables crece, puede que la otra tienda a hacerlo también (al hacer más calor, se venden más helados) o a decrecer (al crecer el precio de la gasolina se compra menos).

La causalidad aparece en una situación en la que la acción de una de las variables es la que provoca que se produzca la otra: “Cuando se da un fenómeno, se produce el otro, con alta probabilidad y bajo ciertas circunstancias. Una correlación alta puede ser indicio de causalidad, sin embargo, también puede deberse a una tercera variable que cause ambas; o que una de ellas cause una tercera variable que a su vez sea causa de la segunda variable en cuestión; o que no haya conexión entre ambas variables y todo sea una coincidencia”, expone este catedrático.

Entrenar las matemáticas y el espíritu crítico

“Para adoptar una visión más crítica de la realidad y ser menos manipulables, parte del mejor entrenamiento es entender la diferencia entre correlación y causalidad. Muchas decisiones relevantes dependen de la detección de relaciones causa-efecto. Por ejemplo, en medicina, para la introducción de medicamentos y la prohibición de hábitos de consumo; en seguridad aérea, para la implementación de procedimientos de vuelo; en política pública, para la puesta en marcha de medidas económicas. Si creemos que hay una relación causal entre dos o más variables, cuando en realidad no existe, estaremos malgastando recursos inútilmente e, incluso, perjudicialmente", alerta el matemático Ríos.

Dicho esto, ¿qué respuesta daría ahora al planteamiento inicial? Si se retoman los dos ejemplos, en el primero, la herencia genética podría explicar la mayor probabilidad de que los hijos padecieran miopía, y los padres miopes podrían ser los que dejaren la luz encendida del dormitorio, como contradijo después otro estudio publicado también en Nature. En el segundo, por mucho que ambas variables se den a la vez de forma repetida, la filmografía de Nicolas Cage está muy lejos de ser el factor detonante de los ahogamientos en piscina en Estados Unidos, y pocos pueden dudar de que la relación sea producto de la casualidad.

Para Ríos, lo importante es recordar que correlación es solo un síntoma de causación, y por tanto, hay que poner en cuarentena toda conclusión demasiado rápida. “Es importante valorarla de forma crítica y pensar si esta relación es relevante o no. Si no es así, y el fenómeno es suficientemente relevante (por ejemplo, detectar que fumar produce cáncer), se han de realizar estudios aleatorios y controlados para ayudar a dilucidarlo. En ocasiones no son factibles tales estudios y los llamados métodos de inferencia causal pueden ser de ayuda”, anota Ríos.

Muchas decisiones relevantes dependen de la detección de relaciones causa-efecto: la introducción de medicamentos, la implementación de procedimientos de vuelo o la puesta en marcha de medidas económicas

La salida a los engaños basados en datos está en saber interpretar gráficas y estadísticas para entender los riesgos y tomar mejores decisiones como consumidores y votantes. “En ocasiones, se nos muestran correlaciones muy forzadas para tratar de inducir en nosotros cierta causalidad, y por no saber interpretar convenientemente los datos presentados, acabamos creyéndonos algo que posiblemente no sea del todo cierto. Debemos ser muy cautos a la hora de analizar los datos que se nos presentan desde distintas fuentes, ya sean empresas, partidos políticos o medios de comunicación”, concluye.

Puedes seguir Buenavida en Facebook, Twitter o suscribirte aquí a la Newsletter.

Más información