Así están las encuestas en Madrid: la derecha sigue delante, pero la izquierda eleva sus opciones
Una mayoría de PP y Vox sigue siendo el resultado más probable, pero la suma de PSOE, Más Madrid y Unidas Podemos mantiene 1 de 7 opciones
Esta semana ha añadido incertidumbre a las elecciones, a la espera de ver si los votos se mueven tras lo sucedido en el debate naufragado de este viernes en la SER. De momento, los sondeos publicados mantienen por delante a la derecha, aunque reducen su ventaja. El promedio de sondeos coloca primero al PP (ronda el 41% de los votos), seguido de PSOE (23%), Más Madrid (14%), Vox (9%), Unidas Podemos (7%) y Ciudada...
Esta semana ha añadido incertidumbre a las elecciones, a la espera de ver si los votos se mueven tras lo sucedido en el debate naufragado de este viernes en la SER. De momento, los sondeos publicados mantienen por delante a la derecha, aunque reducen su ventaja. El promedio de sondeos coloca primero al PP (ronda el 41% de los votos), seguido de PSOE (23%), Más Madrid (14%), Vox (9%), Unidas Podemos (7%) y Ciudadanos (4%).
Además, esta semana se han observado movimientos en la izquierda: el PSOE baja un punto en dos semanas y Más Madrid sube del 12,5% al 14%.
El resultado de las elecciones depende de dos claves: la entrada de Ciudadanos —cada vez más complicada— y el equilibrio exacto entre los bloques. La suma de PP y Vox ronda el 50% de votos y aventaja en seis puntos a la suma de PSOE, Más Madrid y Podemos (44%). Pero veamos cómo se traduce eso en escaños y en probabilidades de victoria.
La predicción de escaños
El gráfico siguiente representa nuestra estimación de escaños a partir del promedio de sondeos. El PP rondaría los 59 diputados, seguido de PSOE (33), Más Madrid (20), Vox (13), Unidas Podemos (9) y Ciudadanos (0 de resultado probable; 2 de media).
Para hacer esta estimación usamos un modelo estadístico y simulamos las elecciones 15.000 veces. El modelo se alimenta de sondeos e incorpora una pieza clave de información: su acierto histórico. Eso explica que las horquillas sean amplias: no son caprichosas, sino que representan la precisión que han tenido los sondeos en el pasado. Al final del texto se puede consultar la metodología.
Es fácil ver la incertidumbre que todavía rodea estas elecciones. Los sondeos se equivocan normalmente en un par de puntos por partido, y es frecuente ver errores de tres o cuatro con alguna formación. Eso explica, por ejemplo, que el resultado más probable del PP sea 59 escaños, pero que su intervalo de 90% de probabilidad vaya desde 50 a 69 asientos. Es decir, que una de cada veinte veces veríamos al PP por encima (o por debajo) de esa franja.
Más llamativo es el caso Ciudadanos. Según nuestra estimación, la probabilidad de que logre escaños es sólo del 20% o 25%, porque necesita superar el 5% en votos, pero si lo hace conseguirá 7, o más asientos. Por eso lo más probable es que no consiga representación, pero de media —en las 15.000 simulaciones— saca dos escaños.
La clave: Quién alcanzará la mayoría
La principal ventaja de tener un modelo de predicción es que permite atribuir probabilidades a diferentes resultados, algo que los sondeos no pueden hacer por sí mismos. Así podemos responder la pregunta clave de estas elecciones: ¿Qué partidos tienen opciones de sumar los 69 diputados necesarios? El gráfico muestra el resumen:
- 7 de 10 veces (72%) habrá una mayoría de derechas (PP y Vox). En las 15.000 simulaciones, esa es la frecuencia con que los dos partidos suman los 69 escaños que necesitan. La mayoría en solitario del PP ocurre 1 de cada 20 ocasiones.
- 1 de 7 veces (14%) habrá una mayoría de izquierdas (PSOE, MM y UP). Es la probabilidad de que un cambio de tendencias los ponga delante o de que las encuestas se equivoquen. Aquí se incluye la posibilidad de que tanto Vox como Ciudadanos caigan del 5%, e Isabel Díaz Ayuso se quede sin socios.
- 1 de 10 veces (11%) Ciudadanos será decisivo. Es la probabilidad combinada de que pasen dos cosas: (1) que Cs supere el 5% de votos y logre escaños (20% de probabilidad), y (2) que esos escaños los necesiten derecha e izquierda.
- Y… en 1 de 25 veces se producirá un empate. Como la asamblea reparte un número par de asientos, puede pasar que PP-Vox y PSOE-MM-UP empaten a 68 escaños.
Este último gráfico resume los pronósticos de las encuestas hasta ahora, contando con sus errores en el pasado. De aquí al miércoles seguirán publicándose sondeos, que es posible que cambien. Para averiguarlo, actualizaremos esta predicción aquí, en la web de EL PAÍS.
Suscríbete aquí a la ‘newsletter’ de Kiko Llaneras donde analiza y explica la actualidad con datos y gráficos.
Metodología
Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en las elecciones de abril y noviembre de 2019, en México, Francia, el Reino Unido, Andalucía o Cataluña. Funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar la incertidumbre esperada, y 3) simular 15.000 elecciones para repartir escaños y calcular probabilidades.
Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisión. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha.
Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado e importante. Se necesita estimar la precisión esperada de los sondeos. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en España y miles internacionales.
Calibrar los errores esperados. Primero se estima el error de las encuestas en España. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 2 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, publicada en Nature. Se han analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: 1) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y 2) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).
Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación se utiliza una distribución multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver: "El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda España. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración".
Paso 3. Simular. El último paso consiste en ejecutar el modelo 15.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto número de escaños, alcanzar la mayoría, quedar primero, etcétera.
Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal últimamente. En los últimos dos o tres años han sido bastante precisas en España, aunque con excepciones, como las elecciones andaluzas de 2018. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.