P.M.S
Investigadores del Laboratorio Europeo de Biología Molecular, en colaboración con el Centro Alemán de Investigación del Cáncer (DKFZ) de Alemania y la Universidad de Copenhague de Dinamarca, han desarrollado una herramienta de inteligencia artificial (IA) que predice el riesgo de más de 1.000 enfermedades y simula trayectorias de salud hasta 20 años. El modelo Delphi-2M se basa en el historial médico del paciente y muestra una precisión superior a la de tecnologías existentes que se centran en menos patologías.

La herramienta de IA generativa se diseñó a medida utilizando conceptos algorítmicos similares a los empleados en los modelos de lenguaje extenso (LLM). En concreto, se entrenó con datos sanitarios anónimos de 400.000 participantes del Biobanco del Reino Unido y se probó usando datos de casi dos millones de personas en Dinamarca. El estudio, publicado en Nature, muestra cómo la IA generativa puede modelar la progresión de enfermedades humanas a escala.

«Nuestro modelo de IA es una prueba de concepto que demuestra que la IA puede aprender muchos de nuestros patrones de salud a largo plazo y utilizar esta información para generar predicciones significativas», subraya Ewan Birney, director ejecutivo interino del Laboratorio Europeo de Biología Molecular (EMBL). «Al modelar la evolución de las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo surgen ciertos riesgos y cómo planificar mejor las intervenciones tempranas. Es un gran paso hacia enfoques más personalizados y preventivos de la atención médica».

Funciona como los modelos de lenguaje, pero aplicado a historiales médicos, aprendiendo la “gramática” de los datos de salud (diagnósticos, hábitos, tiempos entre eventos)

Así como los modelos de lenguaje extensos pueden aprender la estructura de las oraciones, este modelo de IA aprende la gramática de los datos de salud para modelar los historiales médicos como secuencias de eventos que se desarrollan a lo largo del tiempo. Estos eventos incluyen diagnósticos médicos o factores de estilo de vida como el tabaquismo. El modelo aprende a predecir el riesgo de enfermedad a partir del orden en que ocurren dichos eventos y el tiempo transcurrido entre ellos.

«Los eventos médicos suelen seguir patrones predecibles», precisa Tom Fitzgerald, científico del Instituto Europeo de Bioinformática del EMBL (EMBL-EBI). «Nuestro modelo de IA aprende esos patrones y puede predecir futuros resultados de salud. Nos permite explorar qué podría suceder con base en el historial médico de una persona y otros factores clave. Fundamentalmente, esto no es una certeza, sino una estimación de los riesgos potenciales».

El modelo funciona especialmente bien en afecciones con patrones de progresión claros y consistentes, como ciertos tipos de cáncer, infartos y septicemia (un tipo de envenenamiento de la sangre). Sin embargo, el modelo es menos fiable en afecciones más variables, como trastornos de salud mental o complicaciones relacionadas con el embarazo que dependen de eventos vitales impredecibles.

Al igual que los pronósticos meteorológicos, este nuevo modelo de IA proporciona probabilidades, no certezas. No predice con exactitud qué le sucederá a una persona, pero ofrece estimaciones precisas de la probabilidad de que ciertas afecciones se presenten en un período determinado. Por ejemplo, podría predecir la probabilidad de desarrollar una enfermedad cardíaca durante el próximo año. Estos riesgos se expresan como tasas a lo largo del tiempo, similar a pronosticar un 70% de probabilidad de lluvia mañana. Generalmente, los pronósticos a corto plazo tienen mayor precisión que los de largo plazo.

Funciona especialmente bien en cáncer, infartos y septicemia, aunque es menos fiable en trastornos mentales y embarazos

Por ejemplo, el modelo predice diferentes niveles de riesgo de infarto. Considerando la cohorte del Biobanco del Reino Unido de 60 a 65 años, el riesgo de infarto varía desde una probabilidad de 4 entre 10.000 al año para algunos hombres hasta aproximadamente 1 entre 100 en otros, dependiendo de sus diagnósticos previos y estilo de vida. Las mujeres presentan un riesgo menor en promedio, pero una distribución similar del riesgo. Además, los riesgos aumentan, en promedio, con la edad. Una evaluación sistemática de datos del Biobanco del Reino Unido, no utilizados para la formación, mostró que estos riesgos calculados se corresponden adecuadamente con el número de casos observados en todos los grupos de edad y sexo.

El modelo está calibrado para generar estimaciones precisas de riesgo a nivel poblacional, pronosticando la frecuencia con la que ciertas afecciones se presentan en grupos de personas. Sin embargo, como cualquier modelo de IA, presenta limitaciones. Por ejemplo, dado que los datos de entrenamiento del modelo, provenientes del Biobanco del Reino Unido, provienen principalmente de personas de entre 40 y 60 años, los eventos de salud infantil y adolescente están subrepresentados. El modelo también presenta sesgos demográficos debido a la falta de datos de entrenamiento, incluyendo la subrepresentación de ciertos grupos étnicos.

El modelo no está listo para su uso clínico, pero podría ayudar a los investigadores a: comprender cómo se desarrollan y progresan las enfermedades con el tiempo; explorar cómo el estilo de vida y las enfermedades pasadas afectan el riesgo de enfermedad a largo plazo, simular resultados de salud utilizando datos artificiales de pacientes, en situaciones donde los datos del mundo real son difíciles de obtener o acceder.

Aún no está listo para uso clínico, pero promete avances hacia la medicina personalizada y preventiva, pese a sesgos en los datos y retos de equidad en la salud digital
Reacciones de la comunidad científica

Gustavo Sudre, profesor de Neuroimagen Genómica e Inteligencia Artificial en el King’s College de Londres (Reino Unido) y titular de la cátedra Rosetrees Pears de Bioinformática, destaca en declaraciones recogidas por Science Media Centre (SMC) que «esta investigación parece ser un paso significativo hacia una forma de modelización predictiva en medicina que sea escalable, interpretable y, lo que es más importante, éticamente responsable. La demostración clara de cómo se puede utilizar la IA explicable para modelizar predicciones es crucial si se quiere utilizar esta tecnología en la práctica clínica y sugiere que podría ser posible identificar a las personas de alto riesgo que necesitan intervención».

Aunque la versión actual se basa únicamente en registros clínicos anonimizados, asegura que «es alentador ver que la arquitectura del modelo se ha diseñado deliberadamente para dar cabida a tipos de datos más ricos, como biomarcadores, imágenes e incluso genómica. Con estas futuras integraciones, la plataforma Delphi está bien posicionada para evolucionar hacia una herramienta de medicina de precisión verdaderamente multimodal».

Por su parte, Peter Bannister, experto en atención sanitaria y miembro de la Institution of Engineering and Technology (Reino Unido), detalla al SMC que «queda mucho camino por recorrer para mejorar la atención sanitaria, ya que los autores reconocen que ambos conjuntos de datos presentan sesgos en cuanto a edad, origen étnico y resultados sanitarios actuales».

Bannister resalta que «si bien la mejora de las puntuaciones de riesgo y el potencial de la medicina de precisión son objetivos interesantes para el futuro, el reto inmediato para la asistencia sanitaria es garantizar que exista una infraestructura digital y una base de competencias suficientes para todos, independientemente de su origen socioeconómico, de modo que las tecnologías actualmente disponibles puedan ofrecerse a quienes más necesitan mejorar su acceso a los tratamientos».