El decalaje temporal de los datos de contagios

Los atrasos en las notificaciones de infecciones de Covid-19 pueden jugar una mala pasada al interpretar la evolución de la incidencia de la pandemia

Un médico del hospital Ramón y Cajal de Madrid realiza una prueba PCR. / ÓSCAR DEL POZO (AFP)

Uno de los principales indicadores para el seguimiento epidemiológico es la incidencia de casos infectados detectados. Y tan importante o más que su magnitud en un momento dado es su tendencia. ¿Los contagios aumentan o disminuyen, y a qué ritmo? Por ello es de gran relevancia no solo cuántos casos se detectan, sino también cómo se distribuyen a lo largo del tiempo. En la fase inicial de la COVID-19 las autoridades sanitarias no se solían complicar: fecha en la que les fue notificado un caso, fecha con la que se registró, independiente de si había sido diagnosticado ese mismo día o hacía una s...

Suscríbete para seguir leyendo

Lee sin límites

Uno de los principales indicadores para el seguimiento epidemiológico es la incidencia de casos infectados detectados. Y tan importante o más que su magnitud en un momento dado es su tendencia. ¿Los contagios aumentan o disminuyen, y a qué ritmo? Por ello es de gran relevancia no solo cuántos casos se detectan, sino también cómo se distribuyen a lo largo del tiempo. En la fase inicial de la COVID-19 las autoridades sanitarias no se solían complicar: fecha en la que les fue notificado un caso, fecha con la que se registró, independiente de si había sido diagnosticado ese mismo día o hacía una semana, y sin tener en cuenta el tiempo que el infectado llevaba ya con síntomas, si es que los tenía. Este retardo hasta la notificación del caso, que además varía mucho según las circunstancias (la saturación del sistema sanitario, la agilidad e informatización del centro que lo registra, etc.) da lugar a una serie temporal desfasada frente a la evolución sanitaria real y sujeta a distorsiones burocráticas debidas al proceso de notificación, ajenas a factores epidemiológicos.

Para evitar estos inconvenientes, ahora la práctica habitual consiste en atribuir cada caso retroactivamente al día de diagnóstico (o incluso de inicio de síntomas, con una fecha imputada en el caso de los asintomáticos). Eso implica que cada día al actualizar la serie temporal, además de añadir un nuevo dato correspondiente al último día, también se actualizan los datos de los días previos, según las fechas de diagnóstico (o inicio de síntomas) de los nuevos casos notificados. De esta forma se obtiene efectivamente una serie temporal más ajustada al trascurso real de la epidemia, pero solo en retrospectiva, pasados unos días o semanas. De cara al seguimiento prospectivo nos enfrentamos a un problema de provisionalidad de los datos recientes. Hoy la incidencia de ayer solo incluye la minoría de casos donde la contabilización ha sido casi inmediata. Con el paso de los días irá creciendo conforme se incorporan también los diagnósticos llegados con más retraso, con lo que el valor puede subir drásticamente. Un dato no es definitivo hasta que pasadas unas semanas puede descartarse la llegada de más notificaciones correspondientes a ese día.

El cambio de criterio en España no fue exento de polémica. El 15 de mayo Madrid destacó que sus 49 contagios del día anterior eran menos que los de Castilla y León o Cataluña, para pedir una desescalada más rápida para su Comunidad. Ello desencadenó críticas desde la vecina Castilla y León, partidaria de una mayor cautela en la vuelta a la normalidad, que alegó que los casos notificados en Madrid el día 14 eran 312, más del doble de los de Cataluña y más del triple de los de Castilla y León. Al margen de que estos datos tendrían que ponerse en relación con la población de cada Comunidad para poder compararlos, la discrepancia se debió a que Madrid, a diferencia de todas las demás Comunidades, ya aplicaba el nuevo criterio, considerando como nuevos solo aquellos casos que también fueron diagnosticados el mismo día 14, asignando los restantes 263 a fechas anteriores según el diagnóstico, con lo que el dato efectivamente no era comparable con los de las demás Comunidades. Este ejemplo nos sirve también para evidenciar el gran alcance de los atrasos en las notificaciones, ya que en el informe de la Comunidad de Madrid del 2 de octubre figuran ya 539 casos diagnosticados el 14 de mayo, lo que multiplica por 11 la incidencia inicial reportada el 15 de mayo, y cuando ya han pasado más de cuatro meses el número aún sigue creciendo informe tras informe.

Por tanto, la asignación retroactiva de los casos implica un decalaje temporal – cuanto más reciente es un dato, más corto se suele quedar frente a su aún desconocido valor definitivo – que introduce una engañosa tendencia a la baja en el tramo final de la serie temporal, bien visible también en los gráficos del Ministerio de Sanidad, que desde el 11 de mayo contabiliza los casos según la fecha de diagnóstico. El siguiente gráfico, procedente de la actualización del 12 de agosto, puede transmitir la impresión que el 7 de agosto España ya pasó el pico de la segunda ola, dando paso a un descenso. Nada más lejos de la realidad, como revelan las actualizaciones más recientes, en las que no queda rastro de este descenso del 7 al 11 de agosto. La incidencia siguió creciendo, hasta alcanzar el 18 de septiembre lo que por ahora parece ser el verdadero pico de la segunda ola, con el triple de incidencia del supuesto pico del 7 de agosto.

El gráfico también muestra el marcado ciclo semanal con bajadas los fines de semana, que supone otro factor de distorsión. Una forma de solventarlo es usar medias móviles de siete días o la incidencia acumulada de los últimos siete (o catorce) días. Así lo hace el Centro Nacional de Epidemiología (CNE) que consolida los datos de contagios reportados por las Comunidades Autónomas, para indicar y comparar las incidencias de la última y penúltima semana natural en un mapa provincial en su panel de COVID-19. Pero últimamente estas comparativas también inducen al error por el decalaje, al cambiar de semana precipitadamente. Con fecha del lunes 28 de septiembre, el primer día de la semana 40, ya se publicaron los datos de la semana 39, con un total de 45.761 casos en toda España, comparado con 69.002 en la semana 38. Supondría una contundente bajada en un tercio, si no fuera porque sobre todo los datos de la semana 39, que acababa de terminar, eran aún muy incompletos. Tanto fue así que en las sucesivas actualizaciones del panel ya en los siguientes tres días la cifra se incrementó paulatinamente casi un 30%, llegando a 58.909 el jueves, mientras la ya más consolidada incidencia de la semana 38 se vio incrementada menos del 5%, hasta 72.198.

Así la caída intersemanal de la incidencia se vio recortada drásticamente y cabe suponer que se irá reduciendo más aún, aunque parece que por fin persistirá un cierto descenso real, a diferencia de la semana anterior, que empezó con datos que indicaban una bajada, que sin embargo con las actualizaciones a lo largo de los siguientes días se acabó convirtiendo en una subida. Es una forma de crear falsas expectativas y de generar desconfianza en los datos oficiales, por mucho que debajo del mapa se avisa de la provisionalidad de los datos. Por ello en nuestra página de seguimiento solemos cambiar de semana varios días o incluso una semana más tarde, en lugar de ofrecer una comparativa más actualizada pero excesivamente sesgada. Contemplando la incidencia de periodos demasiado recientes, se distorsiona además la comparativa entre territorios, debido a las grandes diferencias entre Comunidades Autónomas en los atrasos, que es lo que ocurre con la incidencia acumulada de los últimos catorce y sobre todo los últimos siete días que figuran en las actualizaciones del Ministerio de Sanidad. No son comparables, por ejemplo, los datos de Madrid y Navarra, las dos Comunidades más afectadas en estos momentos, ya que, como revelan los datos, a diferencia de Madrid, Navarra apenas arrastra notificaciones atrasadas por lo que sus incidencias son prácticamente definitivas.

Pero ni siquiera con una prudente espera se está a salvo de desagradables sorpresas. El siguiente gráfico muestra la evolución de la incidencia acumulada en los siete días previos por cada 100.000 habitantes en Madrid, según los datos de la Comunidad publicados por el CNE con fecha del 9 y del 24 de septiembre. El día 9 parecía claro que el crecimiento se había frenado drásticamente, de forma sostenida desde hacía dos semanas ya, por lo que no parecía deberse solo a notificaciones atrasadas, también porque ya era la segunda actualización semanal consecutiva que apuntaba en esta dirección, a diferencia de las anteriores que solo mostraban una tendencia creciente. Pero como evidencian los datos del día 24, en realidad el crecimiento siguió siendo muy pronunciado durante ese periodo, de modo que al final se trataba de un mero espejismo, fruto de una inusual acumulación de notificaciones atrasadas.

Dada la gran importancia del seguimiento de la evolución de la pandemia para evaluar la efectividad de las medidas de contención y tomar decisiones sobre su endurecimiento o relajación, puede ser nefasto llegar a conclusiones excesivamente benévolas o subestimar la seriedad de la situación. Por ello sería importante corregir el decalaje en las series temporales. El historial de notificaciones con su correspondiente retardo del que disponen las autoridades sanitarias les permitiría estimar cuánto subirán aun las incidencias de cada día en función del tiempo transcurrido. Así lo hace el Instituto Robert Koch en Alemania, tanto para visualizar la evolución de la pandemia, incorporando estas estimaciones con su correspondiente margen de error en los gráficos (con otro color, en forma de columnas apiladas), como para estimar la evolución del ritmo reproductivo. Se refieren a ello como nowcast, un pronóstico que a diferencia del forecast no es sobre el futuro sino sobre el presente o momentos muy cercanos al presente.

* Ansgar Seyfferth es director para España y Portugal de la empresa STAT-UP Statistical Consulting & Data Science Services

Archivado En