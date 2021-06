Sarabia recibe instrucciones en el partido contra Suecia. Alejandro Ruesga / EL PAÍS

¡Buenos días! Aprovecho la Eurocopa para contaros cómo las estadísticas están cambiando el fútbol. Es interesante si te gusta el juego, pero también un reto analítico: ¿puedes iluminar con datos algo que ya está mirando tanta gente?

Los datos han supuesto una revolución en muchos deportes, desde el béisbol al baloncesto. Es ya una rutina registrar los eventos del juego y tomar esa información para decidir tácticas, pulir jugadores o hacer fichajes. Esa transformación ha llegado al fútbol más despacio, por sus características o por su cultura menos cuantitativa, pero ahora mismo es una realidad: los datos del fútbol están en ebullición.

El primer paso lo dan empresas como Opta o Statsbomb, que están midiendo miles de acciones de cada partido: pases, carreras, remates. Este lunes, por ejemplo, el checo Patrik Schick marcó un gol desde 45 metros —este gol—, y a los cinco minutos sabíamos que desde 2014 se han hecho 1.554 disparos similares en grandes ligas y que se han marcado 30. Alrededor de estos datos ha surgido una comunidad. Empresas como las españolas Driblab y Olocip, que producen estadísticas avanzadas, hacen predicciones y ofrecen consejos a clubes y agentes. También hay periodistas haciendo analítica, especialistas, aficionados y grupos de investigación.

Son todos pioneros, que es para mí lo más interesante: están aprendiendo a capturar con números un juego sutil. ¿Qué hace bueno a Cristiano Ronaldo o Kevin de Bruyne? Es tentador pensar que son cosas intangibles, pero eso es perezoso. Codificando en detalle sus acciones sobre el campo, sus pases, sus movimiento, sus posiciones, acabaremos por averiguar lo que hacen. Siempre habrá destellos que se perderán, pero estos analistas quieren reducirlos al mínimo.

Lo que estamos viendo es el Cámbrico de las estadísticas en fútbol, la era para probar ideas. Estas son algunas de las métricas más populares.

El valor de tus remates: goles esperados. Fue la primera métrica de éxito, los xG, que consiste en asignar a cada disparo una probabilidad de acabar en gol, para capturar así su valor, según la distancia, el ángulo o el número de defensas entre el balón y la portería. En este ejemplo, con datos de Driblab, podéis ver los xG de España contra Suecia, en su partido del lunes pasado.

Datos de los remates del España - Suecia, por Driblab.

El encuentro quedó 0-0, pero analizar goles esperados añade mucha información. Por ejemplo, si juzgamos los disparos, el resultado "esperado" del partido fue un 1,6-0,9, es decir, que España dominó aunque sin llegar a aplastar. También es preocupante que Suecia se mereciese un gol, aunque solo hizo cuatro remates y se pasó el 85% del tiempo persiguiendo el balón en posesión de España.

Por supuesto, esta métrica de goles esperados se pierde muchas cosas importantes (al fin y al cabo, solo mide remates). Pero eso tiene solución: añadir más métricas. El arsenal de estos analistas es una lista que no para de crecer: cifras de asistencias esperadas (los goles que deberían marcar tus compañeros con tus pases), de construcción (el xG de las cadenas en las que participas), de progresión (los metros que avanzas el balón), de esfuerzos en presión, etcétera. En el partido de España, por ejemplo, Marcos Llorente y Pedri fueron los mejores en construcción; Koke y Jordi Alba, los mejores en creación de peligro y Álvaro Morata quien más presionó.

Llevar el balón a zonas de más peligro. Dos de las métricas de moda son los modelos de peligro esperado (xT) y de valor por acción (VAEP). En ambos casos, la idea es asignar un valor a cada posición del juego: tener la posesión allí se asocia con cierta probabilidad de lograr gol. Sabiendo eso, puedes calcular el valor que añade cada jugador con una acción: imagina que Koke arranco una jugada con valor 0,1 y la dejo en 0,3, gracias a una conducción y un pase fantástico; habrá creado 0,2 xT de peligro. Esta estadística sirve para premiar acciones de un jugador que aumentan la probabilidad de marcar más adelante, aunque no sea asistencias de gol, sino un pase antecesor. Este artículo ilustra muy bien la idea.

Para ver otro ejemplo, en la tabla muestro las estadísticas de disparos (xG) y creación de peligro (xT) de cada jugador en lo que llevamos de Eurocopa.

Aquí se puede <a href="http://www.datawrapper.de/_/T39Wa/">ver la versión interactiva</a>.

Son cifras de uno o dos partidos, pero interesantes. Es curioso ver la producción de Yarmolenko con Ucrania, o los buenos números de Ronaldo en el primer partido de Portugal. También usé estos datos para repasar el España contra Suecia

Estas métricas capturan cada vez más elementos del juego, pero los expertos saben que no son perfectas. Todavía se dejan cosas fuera. Es difícil capturar el valor añadido de un pase entre líneas, por ejemplo, porque eso exige saber dónde está cada defensa en cada momento. También cuesta juzgar a los defensas que se posicionan bien, porque anulan a sus rivales sin hacer una entrada ni una intercepción que quede registrada en datos. Sin embargo, esos vacios se conocen y ya se buscan formas de poder medirlos.

Por último, me interesa pensar en descubrimientos.

Lo que está haciendo la gente de analítica es descifrar el juego. Esa es la tarea de Salvador Carmona y Coré Ramiro, de Esteban Granero y su equipo, de los analistas de Leuven y de un largo etcétera. Andan recogiendo las piezas de un puzle: ¿qué hace excepcional a un jugador o un equipo? Muchas respuestas serán aburridas, porque coincidirán con intuiciones y con el conocimiento que ya tiene el mundo del fútbol, pero también habrá hallazgos genuinos. Se descubrirán virtudes que hasta ahora no recibían la atención merecida, como ha pasado con los triples en baloncesto. Me fascina pensar en un futbolista que repite una jugada, por casualidad o por instinto, que es más valiosa de lo que cree todo el mundo, incluido él mismo.

2. ⚽️ Los datos de la Eurocopa

Este boom de las estadísticas en el fútbol explica que en EL PAÍS hayamos hecho un pequeño despliegue para la Eurocopa. Hemos preparados dos páginas con las estadísticas avanzadas de equipos y jugadores:

¿Cómo de bueno es cada equipo de la Eurocopa? Preparamos una clasificación de fortaleza para medir a cada selección, teniendo en cuenta: (1) la puntuación FIFA (que ahora usa un sistema de puntos Elo tomado del ajedrez), (2) el valor en euros de sus jugadores, (3) la calidad de sus clubes, y (4) sus estadísticas durante el año.

Francia es el mejor equipo de nuestra lista. Es el segundo para la FIFA y el segundo por los 1030 millones que valen sus jugadores, pero las apuestan coinciden con nosotros y lo colocan como el ganador más probable, con un 16% de opciones para vencer. (Nota: no confundir ganador-más-probable con ganador-probable, porque Francia pierde seis de cada siete veces.)

España es la cuarta mejor selección según nuestros números. Las apuestas la colocan quinta en opciones (9%), junto Alemania (10%), Portugal (9%) e Italia (9%).

En el artículo también mostramos las estadísticas que ha logrado cada equipo en sus partidos oficiales desde 2018. Son datos muy finos que nos ha cedido Driblab, la empresa especializada en fichajes de la que os hablé antes, y que tiene datos minuciosos de decenas de ligas.

Las estadísticas de España en sus partidos oficiales desde el mundial de 2018 hasta el inicio de la Eurocopa

Compara los datos de 500 jugadores de la Eurocopa. Al texto sobre equipos le acompaña un comparador con 500 jugadores, con las estadísticas que han logrado en sus clubes esta temporada. Usamos 16 métricas avanzadas, de nuevo de Driblab, con datos de goles esperados, construcción, amenaza, etcétera. El tipo de datos de los que os hablé al principio. En el gráfico siguiente podéis comparar a Mbappé y a Morata, por ejemplo.

Los dos artículos tienen muchos más detalles. Si te interesa (un poco) el fútbol o (un poco) las estadísticas, los tienes aquí y aquí.

3. 🌋 ¿Cómo es ser joven en 2021?

En EL PAÍS hemos dedicado un especial al tema, con reportajes, entrevistas y un podcast. Los datos los hemos puesto Borja Andrino y yo, de momento en dos artículos y una docena de gráficos.

1. España deja atrás a sus jóvenes. Viven en un país mejor que hace 30 o 40 años, pero se enfrentan a problemas que se arrastran: sufren un paro enorme, un tercio está riesgo de pobreza y dos tercios viven con sus padres.

Los jóvenes son ahora un colectivo en riesgo de pobreza o exclusión. Especialmente algunos: el riesgo es triple para quienes no acabaron el instituto (frente a universitarios); y doble para los inmigrantes (frente a los nacidos en España). Hasta la crisis de 2010 el grupo con más vulnerables eran los mayores, pero ya no es así.

Otro dato tremendo: el 64% de los jóvenes viven con sus padres a los 25-29 años. Solo tienen cifras peores Italia, Grecia y algunos países balcánicos. Los nórdicos son otro mundo (5%), pero también Francia (17%) o Alemania (30%).

Última idea: los jóvenes se han quedado atrás mientras el país avanzaba, porque el progreso desde los ochenta se ve en multitud de datos (vivimos más, somos más ricos, más libres).

2. Los números del cráter laboral de los jóvenes en España. Muy pocos jóvenes trabajan en comparación con Europa, y tenemos récord de trabajadores pobres y de contratos que no duran ni semanas.

Solo el 20% de los jóvenes de 15-24 años tienen un empleo de algún tipo, frente al 31% de la UE y lejos de países ricos como Suecia (39%), Alemania (48%) o el Reino Unido (51%).

Esa falta de trabajo continúa a los 25-29 años, tengan o no estudios. Apenas el 59% de españoles con estudios medios están trabajando, frente al 72% de la UE. Y solo dos países tienen peores cifras que España para sus universitarios (70%).

España tiene récords de ultratemporalidad. Los contratos de menos de tres meses son más frecuentes que en casi cualquier país. Incluso entre universitarios, el 7% de los cuales tienen un empleo de semanas, el doble que en la UE.

Al hablar de generaciones se abusan de discursos hiperbólicos. Desde un extremo, se exagera cualquier problema al que te enfrentas de joven, aunque sean dificultades que tuvo mucha gente antes que tú. En el otro, se niegan problemas evidentes que afectan a adultos de 21 o 29 años, algunos arrastrados desde hace décadas. Mirar datos ayuda a equilibrar.

4. Otras dos historias random

… 🔊 El valor de darte a conocer. Un problema con una compañía en la nube, Fastly, provocó la semana pasada que se cayeran varias webs durante una hora (Amazon, Twitch, The New York Times o EL PAÍS funcionaron mal). Era una empresa que casi nadie conoce, aunque se encarga de acelerar muchas webs que usamos. Pero era invisible. Eso explica lo que pasó el día del fallo: ¡ese día sus acciones subieron de valor en lugar de bajar! Pasaron de 50 dólares y los 57 que valían este lunes (aunque ahora andan en 54). Es una paradoja comprensible: aunque las noticias de aquella jornada no fueron buenas para la empresas, acaparar tanta atención le sirvió para que muchos inversores descubriesen que existe y tiene clientes como Amazon y varios gobiernos.

…🏅 El periodista Ed Yong gana el Pulitzer. Yong ha escrito para The Atlantic algunos de los mejores artículos sobre la covid. El jurado lo premia por “anticipar el curso de la enfermedad, sintetizar los retos complejos que enfrentó el país [EEUU], por iluminar los fallos del Gobierno, y por proporcionar contexto claro y accesible del reto científico y humano que suponía”. Su trabajo es brillantísimo. Pero el galardón de Yong me alegra también porque premia unas textos de formato arriesgado en periodismo: es un periodistas riguroso con decenas de fuentes, pero que también se atreve a emitir juicio y sacar conclusiones.

¿Nos ayudas? Reenvía esta newsletter a tus contactos o diles que se apunten aquí. Puedes escribirme con ideas, comentarios o pistas a mi correo (kllaneras@elpais.es) o por Twitter (@kikollan).