_
_
_
_
_

Así se han movido las encuestas en Cataluña

El promedio de sondeos castiga a ERC en favor de la candidatura de Puigdemont. Los independentistas tienen pocas opciones de superar el 50% en votos, según nuestro modelo de predicción

Falta un mes para las elecciones catalanas y las encuestas se han movido. Los sondeos de esta semana detectan dos cambios. El primero es la subida de Junts per Catalunya. El vehículo electoral del PDeCat y Carles Puigdemont ha subido cinco puntos en la media de encuestas. Los damnificados son la CUP y ERC. Quizás han funcionado el cambio de siglas —el sexto en cuatro años para la antigua convergencia— y la confirmación como cabeza de lista de Carles Puigdemont.

Estos movimientos afectan al reparto escaños. ERC obtendría alrededor de 37 diputados y le seguirían Cs, JxCat y PSC. Los comunes, que retroceden, se quedarían cerca de los 10 diputados. PP y CUP aparecen en una zona aún más peligrosa: alrededor del 6% o 7% la pérdida de pocos votos puede suponer perder muchos escaños. Esta estimación de escaños es todavía aproximada —y no es una predicción del 21D—, pero es útil para analizar las posibles mayorías de 68 escaños.

El bloque independentista ronda los 67 escaños y sigue siendo una moneda al aire: sus opciones de tener mayoría de escaños en el parlamento están al 50%. Pero hay una novedad. La caída de ERC aleja a la suma de ERC, CeC —Cataluña en Común— y PSC de lograr los 68 escaños. Esto afecta a los comunes. Sabemos que sus escaños serán clave si el bloque independentista no alcanza la mayoría. Y en general se asume que en ese escenario los de Iglesias y Colau buscarían negociar un gobierno de izquierdas con ERC y el PSC. Ahora los sondeos dicen que esa vía —además de políticamente difícil— podría ser imposible en términos aritméticos. El dilema de los comunes se volvería más complicado: podrían verse obligados a elegir entre apoyar un gobierno independentista o un gobierno con Ciudadanos y PSC.

La (difícil) mayoría de votos independentista

A continuación ofrezco la primera predicción de nuestro modelo electoral del 21D (ver metodología): ¿qué probabilidad tiene el bloque independentista de lograr la mayoría de votos? De acuerdo con el modelo, hay un 21% de probabilidades de que la suma de ERC, JxCat y la CUP consiga la mitad de los votos. En el 79% de las simulaciones, en cambio, sus votos no alcanzan.

El modelo se alimenta de sondeos, pero además tiene en cuenta su precisión histórica (con datos desde 1982). Así puede hacer simular las elecciones y producir predicciones con probabilidades. ¿Pero cómo debemos interpretar esos pronósticos? Una forma sencilla es hacerlo así: «Teniendo en cuenta la imprecisión normal (o esperada) de los sondeos, hay un 21% de probabilidades de que se equivoquen lo suficiente como para que los independentistas logren la mayoría de votos». Es decir, la probabilidad no hay que entenderla como algo filosófico, sino como una medida de incertidumbre.

Por último, podemos usar el modelo para predecir en qué puesto acabará cada partido. Ahora mismo la probabilidad de que ERC sea el más votado es del 74%. Es claro favorito, aunque todavía hay una posibilidad entre cuatro de que pierda el primer puesto. El resto de posiciones están más reñidas todavía. El PSC, por ejemplo, es segundo en el 17% de las simulaciones y quinto en el 10%. 

Estos márgenes son amplios, pero no son caprichosos. Representan la capacidad de predicción que tienen los sondeos a treinta días de las elecciones. No es un sorpresa. Hemos visto que las encuestas en Cataluña están moviéndose, y como todos sabemos, pueden seguir haciéndolo.

Metodología. Los cálculos de probabilidades se basan en un modelos estadístico. El modelo utiliza decenas de sondeos y considera su incertidumbre histórica. Es similar a los modelos que usé en las elecciones francesas (II), en Reino Unido, País Vasco, Galicia y el 26J. El modelo funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar su incertidumbre, y 3) simular 10.000 elecciones para calcular la probabilidad de los distintos resultados.

Paso 1. Agregar y promediar las encuestas. Considero decenas de encuestas del último año. La mayoría de las encuestas consideradas en el promedio pueden consultarse en Wikipedia. Hago un promedio de muchas encuestas para conseguir dos cosas: reducir el error de muestreo y hacer una «cocina» de consenso. El promedio está ponderado por fecha y tamaño de muestra.

Paso 2. Incorporar la incertidumbre de las encuestas al estimar el voto en toda la CCAA. Este paso es fundamental para calcular probabilidades: necesito estimar el acierto histórico de los sondeos en Cataluña. Para eso he usado varias fuentes. La primera son los datos que recopilaron Will Jennings y Christopher Wlezien en un artículo académico: según sus datos el error absoluto medio (MAE) de las encuestas en España entre 1982 y 2011 del último día fue de 2,5 puntos. El MAE un mes antes de las elecciones es de 2,8 puntos. También cuento con una base de datos propia —con resultados de 10 elecciones en España desde 2009— que coloca el MAE entre 2 y 3 puntos. Por último, hay que tener en cuenta que el error de los sondeos es mayor ahora, cuando todavía falta un mes. Según los datos de Jennings y Wlezien, el MAE a 30 días en España es de 2,8 puntos. Además sabemos que en Francia y Reino Unido esa cifra es de 3 puntos. Teniendo todo esto en cuenta he asignado un MAE entre 2,5 y 3,2 puntos para cada partido (errores mayores para partidos con más votos). Esa incertidumbre la incorporo a los porcentajes de voto con una distribución multivariable. Defino la matriz de covarianzas teniendo en cuenta 1) que los votos deben sumar 100%, y 2) que la desviación estándar de los partidos con menos votos es más pequeña que la de aquellos con más votos. Para definir esta matriz uso estas ideas de Chris Hanretty. La distribución es una t-student en lugar de una normal. Así la distribución tiene colas más largas: eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver.

Paso 3. Simular. El último paso consiste en ejecutar el modelo 10.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según las distribuciones definidas en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades de que haya una mayoría de ciertos partidos, de que un candidato logre cierto número de votos, quede primero, etc.

Estimación de escaños. Esta estimación es todavía una versión sencilla y no probabilística —no uso el modelo anterior—. Simplemente he calculado los escaños que obtendría cada partido asumiendo que sus votos pueden moverse en un umbral de ±2,5% de votos alrededor del promedio. Para eso proyecto el voto general sobre cada provincia. Utilizo datos provinciales de dos fuentes: los resultados en las elecciones del 26J y del 27S, y la última encuesta del CEO. Para estimar los escaños en cada provincia aplico la regla de d'Hondt con un umbral mínimo del 3%.

Por qué encuestas. El modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que a nivel nacional fallaron por pocos puntos incluso con Trump y con el Brexit. En otras elecciones recientes, como las francesas, las holandesas o las de País Vasco y Galicia, dieron menos que hablar pero estuvieron acertados. Las encuestas raramente son perfectas, pero son capaces de predecir elecciones en términos probabilísticas. No existe una alternativa que haya demostrado mayor capacidad predictiva.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Sobre la firma

Kiko Llaneras
Es periodista de datos en EL PAÍS y doctor en ingeniería. Antes de llegar al periódico en 2016 era profesor en la Universitat de Girona y en la Politécnica de Valencia. Escribe una newsletter semanal, con explicaciones y gráficos del día a día, y acaba de publicar el libro ‘Piensa claro: Ocho reglas para descifrar el mundo’.

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_