Un modelo de IA permite predecir las enfermedades que tendrás en 20 años
Esta tecnología serviría para cambiar estilos de vida a tiempo o diseñar políticas sanitarias, pero los expertos advierten de su posible uso incorrecto por parte de aseguradoras o bancos


En el mundo de la prevención y la medicina personalizada, es clave la capacidad de prever con mucho tiempo de antelación, incluso décadas, la posibilidad de que una enfermedad aparezca, para atajar los procesos que la producirían mucho antes de que haya empezado a hacer daño. Eso es lo que parece que se puede lograr gracias a la inteligencia artificial, según un estudio publicado hoy en la revista Nature.
A lo largo de la vida, empezamos estando bien con mayor frecuencia, de vez en cuando pasamos algún día enfermos, y con el paso del tiempo empiezan a aparecer las dolencias crónicas. Estos patrones afectan de una forma distinta a cada individuo, dependiendo de la herencia, el estilo de vida o su estatus socioeconómico. Para entender bien la salud de una persona y valorar los riesgos que la acechan en el futuro, no basta con tomar los diagnósticos aislados que recibió a lo largo de su vida; es necesario entender la evolución de cada persona, conocer las enfermedades que sufrió para saber cómo se influyen entre sí y promover cambios de vida específicos o recomendar pruebas diagnósticas que vigilen dolencias concretas con mayor probabilidad de aparecer.
Hoy, un grupo de investigadores del Instituto Europeo de Bioinformática, el DKFZ (Centro Alemán de Investigación del Cáncer) y varias instituciones danesas propone aplicar la misma tecnología que da vida a los grandes modelos de lenguaje –como ChatGPT– para aprender y predecir la historia natural de más de mil enfermedades al mismo tiempo. El modelo resultante, bautizado como Delphi-2M, es capaz de identificar patrones de enfermedad a partir de historiales médicos, factores de estilo de vida y condiciones previas de salud.
“El hallazgo más inesperado fue que el modelo puede predecir más de 1.000 enfermedades. Habríamos esperado que funcionara con algunas, pero que fallara con muchas otras. Esto muestra lo interconectadas que están muchas enfermedades y resalta la necesidad de investigar los mecanismos subyacentes que las conectan”, explica sobre sus resultados Moritz Gerstung, director de la División de Inteligencia Artificial en Oncología del DKFZ y coautor del estudio.
El algoritmo ha sido entrenado con datos de 400.000 personas del Reino Unido y validado con registros de casi dos millones de pacientes en Dinamarca, y es capaz de proyectar trayectorias de salud, tanto a nivel poblacional como individual, de hasta dos décadas.
Como sucede con las predicciones meteorológicas, este modelo no ofrece certezas, sino probabilidades. Más que adivinar exactamente qué le ocurrirá a una persona concreta en un momento determinado, calcula las probabilidades de que sufra ciertas enfermedades en un periodo concreto. Como sucede con el tiempo, las predicciones a corto plazo son más fiables que las que intentan predecir un futuro más lejano. Cuando se calculan si alguien sufrirá un infarto en los próximos 10 años, el modelo acierta alrededor de siete de cada diez casos. Cuando el periodo temporal se amplía a las dos décadas, se queda en un 14%, algo superior al 12% que se logra sabiendo edad y sexo.
Siguiendo con el caso del infarto, según el modelo, en la cohorte del Biobanco del Reino Unido, los hombres de entre 60 y 65 años pueden tener un riesgo anual de 4 de cada 10.000 hasta 1 de cada 100, dependiendo de sus antecedentes médicos y de sus hábitos de vida. En las mujeres el riesgo medio es menor, pero la dispersión de probabilidades es parecida. Lo más relevante es que, al comparar las predicciones del modelo con datos reales del biobanco que no se usaron en el entrenamiento, se comprobó que los riesgos calculados coincidían con la incidencia observada de casos en distintos grupos de edad y sexo. Esto demuestra que las estimaciones reflejan de forma fiel las tendencias poblacionales reales.
Delphi-2M alcanza una precisión comparable a los mejores modelos específicos para enfermedades como la demencia o el infarto de miocardio, y supera a los algoritmos de predicción de mortalidad. Solo en el caso de la diabetes, un marcador del análisis de sangre (la hemoglobina glicosilada HbA1c) sigue siendo más fiable. Además, el estudio identificó enfermedades que incrementan el riesgo de sufrir otras, como los trastornos mentales o algunos tumores del aparato reproductivo femenino.
Sobre la posibilidad de que conocer con tanta antelación de enfermedades que solo son una posibilidad nos convierta a todos en enfermos preventivos, Gerstung cree que hacen falta más estudios para plantear cómo este conocimiento puede beneficiar a los pacientes. Eso requeriría que las posibles aplicaciones de la IA como asistente de la medicina “deberían probarse en ensayos clínicos aleatorizados, en los que un grupo reciba visitas médicas con apoyo de IA y otro grupo sin él. Tras un período de seguimiento, se evaluará si el grupo asistido por IA obtuvo mayores beneficios en comparación con las consultas tradicionales”, apunta. “Esto también puede incluir evaluaciones subjetivas del bienestar de las personas para valorar los efectos emocionales de conocer o no sus riesgos”, concluye.
En el apartado de posibles riesgos de una herramienta tan potente de predicción de la salud, como la discriminación por parte de las aseguradoras de pacientes con riesgos que les hacen poco interesantes como clientes, Guillermo Lazcoz, miembro del Comité de Ética de la Investigación del Instituto de Salud Carlos III, considera que la aplicación de la IA al procesado de grandes bases de datos de salud añade “una capa más de riesgos a los que ya conocíamos”, como que estos datos acaben en manos de un banco que los utilice para saber, antes de conceder un crédito, si el cliente es propenso a contraer un tipo de cáncer o tener un infarto.
“La IA puede identificar a una persona a partir de datos que se suponían anónimos, lo que exige nuevas medidas de protección”, continúa Lazcoz. Para aplicar estas medidas, “en Europa se están desarrollando espacios seguros del tratamiento de datos, donde el dato no viaja y el acceso a terceros está limitado en el tiempo y a un propósito”, explica. Por último, advierte de que no es lo mismo hablar de organizaciones como el Biobanco del Reino Unido, utilizado en el estudio que hoy publica Nature, que cuenta con estrictos controles, que de empresas como 23andMe, en la que uno puede analizar su ADN para conocer su linaje y que ya se ha visto envuelta en escándalos por problemas con la protección de datos.
Mikel Recuero, investigador de la Universidad del País Vasco (EHU) y abogado especializado en protección de datos, coincide en que, al menos en el ámbito europeo, hay muchas capas de control que buscan impedir el uso indebido de datos biomédicos. “El acceso a biobancos ya implica un primer filtro ético, porque los investigadores deben justificar la finalidad científica de su solicitud y no pueden emplear muestras con fines espurios”, señala. “A ello se suman los controles de protección de datos: si la información es identificable, la normativa obliga a restringir su uso a los propósitos autorizados, evitando, por ejemplo, las aplicaciones en seguros o banca”, añade.
En este sentido, “el nuevo reglamento del espacio europeo de datos de salud refuerza esta lógica al prohibir expresamente decisiones comerciales —como la modificación de primas de un seguro— basadas en información genética”, asevera. “Aunque los riesgos nunca desaparecen del todo, existen mecanismos sucesivos (éticos, regulatorios, jurídicos) que actúan de forma preventiva, limitando las posibilidades de discriminación y obligando a acreditar un beneficio social en cada proyecto que vaya a usar estos datos”, concluye.
Los modelos como GPT-4 o Gemini aprenden el lenguaje como una secuencia de palabras. Predicen la siguiente palabra en función del contexto y los investigadores vieron una analogía con la salud. El historial médico de una persona también puede entenderse como una secuencia de eventos –diagnósticos, factores de riesgo, hábitos de vida– que siguen un orden temporal para hacer predicciones.
De momento, el modelo se debe mejorar para tener utilidad para cuidar la salud de pacientes reales, pero ya es una herramienta útil para entender mejor cómo se desarrollan las enfermedades y cómo progresan, o evaluar los efectos del estilo de vida o las enfermedades pasadas influye en el riesgo de enfermedades futuras.
Uno de los aspectos más innovadores del trabajo es la capacidad de Delphi para generar datos de salud sintéticos. A partir de información parcial, el modelo puede imaginar trayectorias completas que mantienen las mismas propiedades estadísticas que los datos reales, pero sin corresponderse con ninguna persona en particular. Esto protege la privacidad de los pacientes, ya que los datos no pueden vincularse a individuos reales y permiten entrenar otros modelos de IA sin necesidad de acceder a datos clínicos sensibles. Así se podría, por ejemplo, calcular qué le puede pasar a la salud de la población si se incrementa la obesidad en un 5%.
Ahora, ya hay algoritmos que predicen el riesgo de sufrir algunas enfermedades, como los problemas cardiacos o el cáncer de mama, pero ese enfoque no abarca la complejidad real de la salud humana, en la que, muchas veces, conviven múltiples enfermedades que se condicionan entre ellas. En unas sociedades cada vez más envejecidas, será crítica la capacidad para prever la carga de muchas enfermedades y diseñar políticas e inversiones para intentar prevenirlas y estar preparados cuando lleguen.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.
Sobre la firma
