Quién va a ganar las elecciones, según las encuestas

Así es la predicción final de nuestro modelo estadístico a partir de encuestas y 15.000 simulaciones. Con escaños y mayorías

Kiko Llaneras

08 nov 2019 - 01:39Actualizado: 08 nov 2019 - 22:40CET

Compartir en Facebook

Compartir en Twitter

Compartir en Bluesky

Compartir en Linkedin

Copiar enlace

Predicción de escaños. El gráfico muestra la estimación del modelo: el PSOE rondaría los 117 diputados, seguido de PP (92), Vox (46), Unidas Podemos (35) y Ciudadanos (18). Para el cálculo usamos el promedio de los sondeos del lunes, los más recientes que pueden difundirse.

Para hacer esta estimación usamos un modelo estadístico y simulamos las elecciones miles de veces. El modelo se alimenta de encuestas y tiene en cuenta su precisión histórica. Las horquillas son amplias pero no caprichosas: representan la precisión de esos sondeos en el pasado. Al final se puede consultar la metodología.

Quién alcanzará la mayoría. Para gobernar con mayoría absoluta son necesarios 176 escaños. ¿Qué partidos tienen opciones de sumar suficientes diputados? Las encuestas no pueden responder a esa pregunta, pero un modelo como este sí.

La derecha (PP, Vox y Ciudadanos) tiene un 10% de probabilidades de alcanzar la mayoría y la izquierda (PSOE, UP, MP) un 11%. Un acuerdo de la izquierda con PRC, BNG, CC y PNV aumenta sus opciones hasta el 16% (es decir, suman 176 escaños un tercio de las veces). En el 60% de las simulaciones ninguna de estas opciones es posible.

La tabla siguiente muestra otras posibles mayorías y sus probabilidades.

Las 15.000 simulaciones partido a partido. El siguiente gráfico muestra la distribución de escaños en cada simulación. Ahí puede verse la incertidumbre de las encuestas. El PSOE ronda los 117 escaños, pero su intervalo (al 90%) va de 91 a 139 diputados. Hay un 5% de probabilidades de que se salga por abajo y otro 5% de que lo haga por arriba. Estas horquillas reflejan el grado de precisión de las encuestas en el pasado.

Aquí se muestra el resultado del resto de partidos. Sus resultados son más difíciles de precisar porque las muestras autonómicas son más débiles.

La lucha por cada puesto. La tabla representa la probabilidad que tiene cada partido de quedar en cada puesto. El PSOE será primero con una alta probabilidad, aunque no definitiva (86%). Otras posiciones están todavía más abiertas. Vox, por ejemplo, es tercero el 70% de las veces, pero en una de cada cinco simulaciones es cuarto.

Escaños en juego por provincia

¿Quiere saber qué diputados están en juego en su provincia? Consulte este especial que hemos preparado a partir de los datos de nuestro modelo electoral. Ahí puede ver los escaños (casi) seguros, probables y en juego para cada partido y cada provincia.

Consulta <a href="https://elpais.com/especiales/2019/elecciones-generales/escanos-provincias/">los escaños en juego de cada provincia</a>. — Consulta los escaños en juego de cada provincia.

Newsletter. Kiko Llaneras escribe cada semana sobre política con una mirada analítica. Suscríbase a su newsletter y recíbala en tu correo.

Metodología. Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en las elecciones de abril, en México, Francia, el Reino Unido, Andalucía o Cataluña. Funciona en cuatro pasos: 1) agregar y promediar las encuestas, 2) proyectar ese promedio sobre cada provincia, 3) incorporar la incertidumbre esperada, y 4) simular 15.000 elecciones para repartir escaños y calcular probabilidades.

Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisión. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha. Los detalles pueden consultarse en esta página web.

Paso 2. Proyectar el voto a cada provincia. Antes de calcular los escaños es necesario estimar el porcentaje de votos de cada partido en cada provincia. Lo habitual para hacer esto es usar sus resultados en anteriores elecciones. Es sencillo y funciona bien (si un partido crece, es lógico pensar que crecerá más donde ya era más fuerte). Pero la aparición de Más País obliga a hacer algunas modificaciones. El partido de Errejón solo se presenta en algunas provincias y eso añade dos dificultades: 1) decidir cómo distribuir sus votos y 2) penalizar al PSOE y UP en las provincias donde Más País concurre. Para lo primero hemos usado los datos de transferencias desde el resto de partidos (sabemos por encuestas que alrededor del 38% de los votantes de MP vienen del PSOE y el 42% de UP, así que es razonable asumir que al partido le irá mejor donde PSOE y Podemos son fuertes). El segundo problema es que, dado que MP existe solo en algunas partes, no podemos reducir (o aumentar) linealmente los votos de PSOE y UP en todas las provincias, sino que debemos penalizar sus números donde concurre Errejón. Lo hacemos restándoles en cada provincia una parte (38% y 42%) de los votos que tenga allí MP. Esta resta solo aplica parcialmente en la Comunidad Valenciana: MP solo resta a PSOE y UP por los votos que consiga sobre los que ya tenía Compromís.

Paso 3. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado e importante. Se necesita estimar la precisión esperada de los sondeos. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en España y miles internacionales.

Calibrar los errores esperados. Primero se estima el error de las encuestas en España. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 1,9 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, publicada en Nature. Se han analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: i) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y ii) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).

Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación se utiliza una distribución multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis las explica Nate Silver: "El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda España. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración".

Paso 4. Simular. El último paso consiste en ejecutar el modelo 15.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varía según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto número de escaños, alcanzar la mayoría, quedar primero, etcétera.

Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal últimamente. A nivel nacional fallaron por pocos puntos incluso con Trump o con el Brexit, y desde entonces han estado bastante precisas en muchas elecciones, como pasó en México, Brasil, Colombia, Francia, Países Bajos, País Vasco, Galicia o Cataluña. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.

Sobre la firma

Kiko Llaneras

Kiko Llaneras - twitter

Es periodista de datos en EL PAÍS y doctor en ingeniería. Antes de llegar al periódico en 2016 era profesor en la Universitat de Girona y en la Politécnica de Valencia. Escribe una newsletter semanal, con explicaciones y gráficos del día a día, y acaba de publicar el libro ‘Piensa claro: Ocho reglas para descifrar el mundo’.

Escaños en juego por provincia

Sobre la firma

Archivado En