¿Quién va a ganar las elecciones generales?
Así es la predicción de nuestro modelo estadístico a partir de encuestas y 15.000 simulaciones. Con pronósticos de escaños y mayorías
Según nuestro modelo de predicción, el PSOE rondaría los 126 diputados en las elecciones del día 28 de abril, seguido del PP (80), Ciudadanos (51), Unidas Podemos (32) y Vox (28).
Estos pronósticos se calculan con 15.000 simulaciones de un modelo estadístico. El modelo se alimenta del promedio de encuestas y tiene en cuenta su precisión histórica. Al final se puede consultar la metodología.
Quién alcanzará la mayoría. Para escoger presidente y gobernar son necesarios 176 escaños. ¿Qué partidos tienen probabilidades de sumar los suficientes? Las encuestas no pueden responder esa pregunta, pero este modelo sí.
La derecha tiene un 17% de probabilidades de alcanzar la mayoría (1 opción de 6) y la izquierda un 21% (1 de 5). En el 62% restante de las veces (5 de 8) ningún bloque suma 176 diputados. Son unas elecciones muy inciertas.
La tabla siguiente muestra otras combinaciones:
Las 15.000 simulaciones partido a partido. El gráfico muestra la distribución de escaños en cada simulación. Ahí puede verse la incertidumbre de las encuestas. El PSOE ronda los 127 escaños, pero su intervalo (al 90%) va de 96 a 154 diputados. Hay un 5% de probabilidades de que se salga por abajo y otro 5% de que lo haga por arriba. Estas horquillas pueden parecer excesivas, pero no son caprichosas: reflejan el grado de precisión de las encuestas en el pasado.
Aquí se muestra el resultado del resto de partidos:
La lucha por cada puesto. En la tabla se representa la probabilidad que tiene cada partido de quedar en cada puesto. El PSOE tiene casi asegurado ser primero, pero la competición por abajo está muy abierta. Vox es quinto en 6 de cada 10 simulaciones, cuarto en 3 de cada 10 y tercero un 10% de las veces.
Los escaños en juego por provincias
¿Quiere saber qué diputados están en juego en su provincia? Consulte este especial que hemos preparado a partir de los datos de nuestro modelo electoral.
Una newsletter de encuestas
¿Quieres seguir las elecciones con todos los datos? Suscríbete a la newsletter de Kiko Llaneras y recíbela en tu correo.
Metodología. Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en México, Francia, el Reino Unido, Andalucía o Cataluña. Funciona en cuatro pasos: 1) agregar y promediar las encuestas, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 4) simular 15.000 elecciones para repartir escaños y calcular probabilidades.
Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisión. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha. Los detalles pueden consultarse en esta página web.
Paso 2. Proyectar el voto a cada provincia. Antes de calcular los escaños es necesario estimar el porcentaje de votos de cada partido en cada provincia. Para hacerlo, se usan los resultados de las elecciones de 2016 y algunos ajustes con encuestas provinciales.
El voto nacional de PP, PSOE, Cs, UP, ERC, JxCat, PNV, Bildu, Pacma y CC se proyecta linealmente sobre cada provincia tomando la distribución de sus votos en 2016 como referencia. Con Vox, en cambio, se usan las transferencias desde el resto de partidos hacia la formación. Se sabe por encuestas del CIS, Metroscopia e IMOP que alrededor del 60% de los votantes de Vox vienen del PP, un 18% de Cs, un 3% del PSOE, un 4,5% de Podemos y un 15% de la abstención. Eso permite estimar su voto en cada provincia a partir del voto de esos partidos en 2016, asumiendo que los flujos son iguales en todas ellas. Esa distribución se corrige en Galicia con datos de las encuestas recientes de Sondaxe. También se utilizan datos de Sondaxe para proyectar el voto de En Marea, BNG y Podemos en Galicia. En la Comunidad Valenciana, se proyecta el voto de Compromís y Unidas Podemos tomando sus resultados de las autonómicas de 2015.
Paso 3. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado e importante. Se necesita estimar la precisión esperada de los sondeos. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en España y miles internacionales.
Calibrar los errores esperados. Primero se estima el error de las encuestas en España. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 1,9 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, recientemente publicada en Nature. Se han analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).
Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación se utiliza una distribución multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver: "El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda España. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EEUU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración".
Paso 4. Simular. El último paso consiste en ejecutar el modelo 15.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto número de escaños, alcanzar la mayoría, quedar primero, etcétera.
Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal últimamente. A nivel nacional fallaron por pocos puntos incluso con Trump o con el Brexit, y desde entonces se han estado bastante precisos en muchas elecciones, como pasó en México, Brasil, Colombia, Francia, Países Bajos, País Vasco, Galicia o Cataluña. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.