La importancia de interpretar bien los datos y modelos de la Covid-19
Para ajustar los modelos matemáticos se usan datos que cambian muy rápido, lo que provoca errores en las predicciones y grandes intervalos de incertidumbre
En estos días de emergencia sanitaria provocada por la Covid-19 vivimos en un mar de datos: número de casos reportados, activos, confirmados; pacientes curados, en UCI, etcétera. Sin embargo, los datos absolutos no ofrecen una buena perspectiva de lo que está ocurriendo. Por ejemplo, el 5 de abril, en Cataluña había unos 26.800 casos confirmados mientras que en Castilla y León, unos 9.100. Así, una conclusión rápida es que Cataluña triplica el número de casos por coronavirus de Castilla y León; sin embargo, teniendo en cuenta que Cataluña tiene el triple de población, la incidencia es similar en ambas comunidades.
De igual manera, la semana pasada se alcanzaba diariamente un macabro récord respecto al número de fallecidos. Por ejemplo, el día 1 de abril hubo aproximadamente 950 fallecimientos, de entre unos 73.490 casos activos, lo que representa el 1,3%. El 10 de marzo hubo un total de 35 fallecimientos, por lo que podría parecer, a primera vista, que en 20 días la mortalidad por coronavirus se ha multiplicado por 27. Sin embargo, teniendo en cuenta que ese día había unos 1.590 casos activos, el número de decesos representa un 2,2%, por lo que la tasa de mortalidad sobre casos activos se ha reducido a la mitad.
Más importante que los términos absolutos es la tasa de crecimiento, es decir, el incremento de contagios. Las semanas anteriores el incremento de casos confirmados –es decir, el aumento de un día respecto al anterior– superó el 20% mientras que la semana pasada ha terminado por debajo del 5%. Por tanto, podemos afirmar que la tendencia es buena y señala que se irán reduciendo los nuevos casos.
La última semana, el Imperial College de Londres publicaba un informe, que tuvo gran eco, en el que, según el modelo usado, en España el 15% de la población podría haberse infectado ya. Este valor es una media del intervalo de confianza que ofrece el informe, entre el 3,7% y el 41%; es decir, afirman que con cierto parámetro estadístico de incertidumbre en España podría haber entre un 3,7% y un 41% de infectados. Con este intervalo de contagiados podríamos estimar, usando la tasa de mortalidad de China –aproximadamente del 1%–, que el número de fallecimientos en España estaría entre 17.000 y 190.000. Efectivamente, es muy probable que el número final se encuentre entre esas cantidades, pero, ¿qué valor tiene esa predicción? Un intervalo tan grande crea demasiada incertidumbre. Si pensamos que muchos de esos fallecidos necesitarán pasar por la UCI ¿cómo podemos prepararnos? ¿Cuántas camas en la UCI o cuántos respiradores son necesarios?
Estos números se calculan a través de un modelo matemático basado en el comportamiento de la enfermedad y de los datos reportados, que según parece tiene bastante solidez; por tanto, ¿por qué recibimos resultados tan vagos? En una situación muy compleja, como la evolución de una pandemia, intervienen muchos factores, parámetros y variables. El modelo tiene como objetivo proporcionar una versión simplificada de la realidad, puesto que describir el proceso real es imposible. Para ello se eligen los parámetros y las variables más importantes y con estos se proponen unas ecuaciones que describen el comportamiento. Una vez que se ha elegido el modelo, su resolución deja poco lugar para el error, en la mayoría de los casos. Pero esto no quiere decir que el modelo sirva para hacer buenas predicciones, puesto que se han podido obviar variables importantes o se han podido cometer errores en la estimación de los parámetros que hagan que el modelo se aleje de la realidad.
En el caso de la Covid-19 se están usando muy buenos modelos, desde un punto de vista matemático o epidemiológico. Pero, aun así, es difícil hacer pronósticos a muy largo plazo del comportamiento de la pandemia -al igual que ocurre por ejemplo con las predicciones meteorológicas-, ya que los datos crecen exponencialmente. Hace mes y medio había un par de casos reportados en España, y ahora se han superado los 100.000. Para ajustar el modelo estamos usando datos que cambian muy rápido, y esto crea errores en las predicciones que producen incertidumbres como las que mencionábamos anteriormente. Además, las medidas que se están tomando alteran los parámetros de los que parte el modelo. Por otro lado, las diferencias en la forma de contabilizar el número de casos positivos o el número de defunciones por la Covid-19 entre los distintos países, o incluso entre las distintas comunidades, también afectan al modelo.
Como resultado, obtenemos conclusiones que no son del todo útiles en el largo plazo, y la toma de decisiones es por tanto complicada. No podemos saber cuánto va a durar esto, ni cuantos días necesitaremos para que la pandemia empiece a remitir. Pero desde luego, una lectura sopesada y racional de los datos disponibles evitará propagar el pánico, y enfrentar esta situación de la mejor manera posible.
José María Martell es director del Icmat e investigador científico del CSIC en el Icmat
Café y Teoremas es una sección dedicada a las matemáticas y al entorno en el que se crean, coordinado por el Instituto de Ciencias Matemáticas (Icmat), en la que los investigadores y miembros del centro describen los últimos avances de esta disciplina, comparten puntos de encuentro entre las matemáticas y otras expresiones sociales y culturales y recuerdan a quienes marcaron su desarrollo y supieron transformar café en teoremas. El nombre evoca la definición del matemático húngaro Alfred Rényi: “Un matemático es una máquina que transforma café en teoremas”.
Edición y coordinación: Ágata Timón (Icmat).
Puedes seguir a Materia en Facebook, Twitter, Instagram o suscribirte aquí a nuestra newsletter