Análisis

Exposición didáctica de ideas, conjeturas o hipótesis, a partir de unos hechos de actualidad comprobados —no necesariamente del día— que se reflejan en el propio texto. Excluye los juicios de valor y se aproxima más al género de opinión, pero se diferencia de él en que no juzga ni pronostica, sino que sólo formula hipótesis, ofrece explicaciones argumentadas y pone en relación datos dispersos

¿Quién va a ganar las elecciones en México? Así cierran las encuestas

La última predicción de EL PAÍS mantiene como favorita a Claudia Sheinbaum, con un 92% de probabilidades de ser presidenta. La opositora Xóchitl Gálvez conserva una opción entre doce para imponerse por sorpresa

Kiko Llaneras

29 may 2024 - 06:00Actualizado: 29 may 2024 - 12:41CEST

A pocos días de la votación, los sondeos convierten a Claudia Sheinbaum en la gran favorita para ganar la presidencia de México. En el promedio de encuestas que elabora EL PAÍS, la candidata oficialista ronda el 54% del votos estimado, bastante por delante de Xóchitl Gálvez (36%) y Jorge Álvarez Máynez (10%).

Sheinbaum ha visto reducirse su ventaja en las últimas semanas. Llegó a tener más de 30 puntos sobre Gálvez, frente a los 18 puntos actuales. Pero su margen sigue siendo amplio en casi todos los estudios demoscópicos. Una sorpresa no puede descartarse, si los sondeos fallan con estrépito o si ocurre algo noticioso de aquí al domingo, pero ambas cosas son improbables.

¿Es segura la victoria de Sheinbaum?

Según el modelo de predicción de EL PAÍS, Sheinbaum tiene alrededor de un 92% de probabilidades de ser ganadora, frente al 8% de opciones que conserva su rival, Xóchitl Gálvez. Nuestro modelo es similar a los que hemos usado en decenas de elecciones, incluidas las últimas presidenciales en México. Como se explica al final, la predicción funciona en tres pasos: (1) partimos del promedio de encuestas; (2) añadimos incertidumbre según el error histórico de los sondeos; y (3) simulamos las elecciones 20.000 veces para asignar probabilidades de victoria.

Como repito a menudo, es importante interpretar bien las cifras anteriores: representan probabilidades. Sheinbaum es una favorita clara, que gana 9 de cada 10 veces. Pero Gálvez no está descartada, porque los sucesos de probabilidad 8% ocurren de manera rutinaria. Una victoria suya por sorpresa es tan fácil (o tan difícil) como ver a Stephen Curry u otro especialista en tiros libres fallar un lanzamiento. En realidad, lo que estamos describiendo es la probabilidad de que los sondeos se equivoquen (o se muevan) lo suficiente como para que Gálvez se imponga a Sheinbaum.

Otros pronósticos con metodologías diferentes coinciden en ver a Sheinbaum como la firme favorita este domingo.

La comunidad de predicción Metaculus, que tiene uno de los mejores históricos de acierto, dice que la victoria de Sheinbaum es 89% probable. Y en el mercado de pronósticos Polymarket, le dan un 90% de probabilidades. Por último, en Expansión han publicado los resultados de otro modelo basado en sondeos, que eleva la probabilidad de la victoria de Sheinbaum hasta el 98%.

Metodología

Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. Uno similar a los que usamos en España en 2023 y dos veces en 2019, en Andalucía, Cataluña o Madrid. . También en México hace seis años, en Francia o el Reino Unido. El modelo funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar la incertidumbre esperada, y 3) simular 20.000 elecciones calcular probabilidades.

Paso 1. Promediar las encuestas. Nuestro promedio tienen en cuenta docenas de sondeos para mejorar su precisión. Los datos han sido recopilados en su mayoría por la web Oraculus.mx. El promedio está ponderado para dar distinto peso a cada encuesta según dos factores: la casa encuestadora (las empresas sin trayectoria tienen menos peso; las que no publican sus datos en el INE son excluidas) y la fecha. Queremos dar más peso a las encuestas recientes al calcular el promedio, y que el último día solo importan las últimas publicadas por cada encuestador. Para eso asignamos pesos a los sondeos según una ley decreciente exponencial. Y definimos una franja de exclusión que ignora las encuestas con más de 30 días de antigüedad. Además, penalizamos las encuestas repetidas de un mismo encuestador. Al calcular el promedio en una fecha, la encuesta más cercana de cada casa tiene peso uno, pero el resto de sus estudios casi se ignoran.

Los promedios como el nuestro pueden verse como una estimación de consenso. En lugar de confiar en un único encuestador, agregan el criterio y las hipótesis de muchos. Los promedios reducen el ruido, evitando que las tendencias salten arriba y abajo por azar. Y sobre todo: se ha demostrado que mejoran la precisión.

Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado y más importante. Necesitamos estimar la precisión esperada de los sondeos en México. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 3, 5 o 15 puntos? Para responder esas preguntas se estudian decenas de encuestas en México y miles internacionales.

Calibrar los errores esperados. Primero he estimado el error de las encuestas en México. He construido una base de datos con encuestas de siete elecciones desde 2000. El error absoluto medio (MAE) de los promedios de encuestas en México, por candidato o partido, considerando aquellos con más del 10% de votos, ha rondado los 3,8 puntos en las presidenciales y los 2,2 puntos en las legislativas. Es decir, fueron habituales desviaciones de cuatro o cinco puntos y el margen de error (95%) rondó los nueve puntos. Como siete elecciones son pocas para extraer conclusiones fuertes, también revisamos una veintena de votaciones en otros países de Latinoamérica, donde el error MAE se elevó al 4,1 puntos. Al final, siguiendo un principio de cautela, he decidido que nuestro modelo asuma un MAE de 3,8 puntos en México.

Además, esa incertidumbre se modula teniendo en cuenta dos factores adicionales: el tamaño del candidato/partido (porque es más fácil estimar el voto de un partido si ronda el 5% que si se acerca al 50%) y la cercanía de las elecciones (porque las encuestas del final son casi siempre más precisas). Para ajustar esta parte del modelo he recurrido a la base de datos de Jennings y Wlezien, publicada en Nature, y analizado los errores de 4.100 encuestas en 241 elecciones de 19 países occidentales.

Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada candidato/partido en cada simulación utilizo una distribución multivariable. Uso distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explicó Nate Silver. El nivel de curtosis lo he estimado con la base de datos anterior. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración.

Paso 3. Simular. El último paso consiste en ejecutar el modelo 20.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada candidato de ser el más votado y alcanzar la presidencia.

Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas funcionan. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.

Suscríbase a la newsletter de EL PAÍS México y al canal de WhatsApp electoral y reciba todas las claves informativas de la actualidad de este país.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Añadir usuario Continuar leyendo aquí

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Sobre la firma

Kiko Llaneras

Es periodista de datos en EL PAÍS y doctor en ingeniería. Antes de llegar al periódico en 2016 era profesor en la Universitat de Girona y en la Politécnica de Valencia. Escribe una newsletter semanal, con explicaciones y gráficos del día a día, y acaba de publicar el libro ‘Piensa claro: Ocho reglas para descifrar el mundo’.