La inteligencia artificial ha demostrado ser capaz de revolucionar todo lo que toca. Desde la salud al transporte, desde el márketing a las finanzas, el diseño industrial, el cine, los seguros, la publicidad o el desarrollo de software, las aplicaciones de la IA parecen no … tener límite. Pero toda revolución tiene sus riesgos y un estudio pionero recién publicado en ‘Science’ acaba de poner el dedo en la llaga de una revolución quizá menos conocida, pero que tiene el potencial de ser extremadamente peligrosa: la ingeniería de proteínas.

En este campo, en efecto, la IA permite diseñar, prácticamente desde cero, nuevas moléculas capaces de curar enfermedades, fijar el dióxido de carbono atmosférico, devorar plásticos o fabricar biocombustibles sostenibles. Pero el nuevo estudio, liderado por Bruce Wittmann, de Microsoft, acaba de confirmar algo que ya se sospechaba y que supone un grave peligro para todos: los sistemas de cribado de bioseguridad fallan al detectar variantes de proteínas peligrosas generadas por la propia IA, lo que abre la puerta a un potencial uso malicioso, o accidental, que podría llegar a tener consecuencias desastrosas.

La comunidad científica global se encuentra en una encrucijada que resulta, al mismo tiempo, fascinante y aterradora. Así, mientras la IA avanza y cobra cada vez más protagonismo en la creación biológica, las defensas humanas diseñadas para contener ese poder demuestran ser peligrosamente frágiles. La noticia ha caído como una bomba y, en su artículo, el mensaje de Wittmann y sus colegas resulta claro y contundente: en el campo del diseño de proteínas, la IA ha superado a sus guardianes.

El estudio, fruto de un inédito ejercicio de ‘Equipo Rojo de IA’ (AI Red Teaming) que reunió a gigantes tecnológicos como Microsoft, la industria de la síntesis de ADN (incluida la empresa Twist Bioscience) y expertos en bioseguridad, confirmó lo que muchos ya temían: la IA se ha vuelto ya tan sofisticada a la hora de diseñar proteínas que es perfectamente capaz de crear variantes de toxinas y patógenos que pueden ‘volar bajo el radar’ de los sistemas de detección actuales.

Y no se trata de un simple peligro teórico, sino de una vulnerabilidad crítica debidamente probada en un entorno controlado. El equipo, en efecto, generó digitalmente más de 75.000 variantes de proteínas peligrosas y las envió a los programas de cribado de bioseguridad (BSS) más utilizados por las empresas que fabrican ADN sintético a medida. El resultado fue desalentador: aunque el software funcionaba ‘casi a la perfección’ para detectar las secuencias originales de las proteínas peligrosas, su capacidad para identificar las nuevas variantes, sutilmente reformuladas por la IA, fue ‘inconsistente’ y falló de manera significativa.

Pero lo más preocupante fue que, a pesar de las rápidas correcciones aplicadas por los proveedores de BSS en colaboración con los investigadores, cerca del 3% de las variantes con mayor probabilidad de retener funcionalidad letal aún lograron escapar a la detección. Eric Horvitz, director científico de Microsoft y coautor principal del estudio, resume la situación con una frase que lo dice todo: «Los avances de la IA están impulsando descubrimientos en biología y medicina, pero con el nuevo poder viene la responsabilidad de la vigilancia y la gestión reflexiva del riesgo».

IA, el ‘arquitecto’ de la vida

Para entender hasta dónde llegan los riesgos, basta con echar un simple vistazo al extraordinario poder que la IA ha otorgado a la ciencia de las proteínas, que son, en esencia, las ‘máquinas moleculares’ de la vida, los constructores, catalizadores, mensajeros y defensores de nuestro organismo. Una proteína es una larga cadena de aminoácidos que se pliega de manera precisa y en una forma tridimensional única. Y es esa forma, esa arquitectura exquisita, la que determina su función: desde cortar y pegar ADN hasta permitir que una célula muscular se contraiga o que un anticuerpo neutralice un virus.

Durante décadas, la ingeniería de proteínas se había basado en tomar las ‘máquinas’ que ya existían en la naturaleza y modificarlas ligeramente, como un herrero que retoca una herramienta ancestral. Pero la irrupción de la Inteligencia Artificial Generativa (GenAI), la misma que nos permite clonar voces o generar fotos y vídeos con una simple orden oral o escrita, ha cambiado las reglas del juego de forma radical.

Herramientas basadas en Deep Learning, en efecto, comoAlphaFold, desarrollado por DeepMind (Google), y RoseTTAFold, del Instituto de Diseño de Proteínas de la Universidad de Washington, dirigido por el biofísico computacional David Baker, galardonado con el Premio Nobel de Química en 2024 (junto a Demis Hassabis y John Jumper), han dotado a los científicos de la capacidad de ‘saltarse’ de golpe miles de años de evolución. Así, y en lugar de modificar lo ya existente, la IA permitirá a partir de ahora diseñar, desde cero, proteínas con cualquier estructura o función que deseemos, incluso lad que antes no estaban en ningún ser vivo conocido.

Entrenadas con la práctica totalidad de las estructuras proteicas conocidas, los nuevos modelos de IA han aprendido la ‘gramática’ química y biológica de las proteínas. Y al igual que un modelo de lenguaje avanzado como ChatGPT, entrenado con miles de millones de palabras, puede generar texto coherente y original, sistemas como ProteinSGM o ESM3 se entrenan con miles de millones de secuencias proteicas. Y en lugar de frases, ‘escriben’ moléculas funcionales.

Imaginemos ahora un gran espacio de diseño donde una IA combina aminoácidos para crear proteínas. Y recordemos que, para una proteína de apenas 100 aminoácidos, existen más combinaciones posibles que átomos hay en el Universo observable. Por eso, buscar una proteína con una función específica mediante métodos tradicionales (prueba y error en el laboratorio) era como buscar una aguja en un billón de pajares, una tarea que podía llevar meses o incluso años de intenso trabajo. La IA, sin embargo, es capaz de saltarse ese laberinto y generar, en minutos, la secuencia de aminoácidos que, al plegarse, formará la estructura perfecta para realizar una tarea concreta: una vacuna más estable al calor, una enzima capaz de descomponer el CO2, o de degradar plásticos, o un anticuerpo que ataque una diana tumoral específica. El profesor Alfonso Valencia, director de Ciencias de la Vida en el Centro Nacional de Supercomputación de Barcelona (BSC), destaca la revolución de esta GenAI, comparándola con el avance de ChatGPT para la creación de textos artificiales: «La capacidad de los sistemas de IA generativa (GenAI) para generar proteínas completamente nuevas ha revolucionado la biotecnología».

El cuello de botella de la bioseguridad

A pesar de que el diseño sea digital, la creación física de la proteína en un laboratorio requiere un paso ineludible: ordenar la molécula de ADN (el gen) que codifica esa nueva ‘máquina’. Y resulta que la industria de la síntesis de ácidos nucleicos, las empresas que fabrican el ADN por encargo, se ha convertido en el ‘cuello de botella’ o el punto de control clave en el proceso de ingeniería de proteínas asistida por IA.

Aquí es, en efecto, donde entran en juego los Sistemas de Cribado de Bioseguridad (BSS). Se trata de programas que actúan como ‘centinelas digitales’, revisando cada pedido de ADN para asegurar que el gen solicitado no codifique una proteína ‘preocupante’, es decir, una toxina, un factor de virulencia o un gen de un patógeno peligroso que pueda ser utilizado con fines maliciosos o terroristas.

Históricamente, estos sistemas han sido robustos, ya que la mayoría de los pedidos siempre correspondían a secuencias conocidas. Pero la IA, que es capaz de crear secuencias inéditas, ha puesto en evidencia su debilidad.

El ‘equipo rojo’ y el blindaje roto

El estudio de Science utilizó la técnica de ‘Equipo Rojo’ (Red Teaming), un concepto tomado de la ciberseguridad que Alfonso Valencia explica con una metáfora sencilla: se trata de someter al sistema a preguntas exhaustivas que prueben su capacidad y consistencia. «Si se le pide a un sistema especializado en finanzas que responda preguntas sobre viajes -explica el investigador-, y contesta, sabemos que está operando fuera de su ámbito y debe ser corregido».

En el ámbito biológico, el Red Teaming consistió en utilizar software de diseño de proteínas de código abierto para generar variantes sintéticas de toxinas conocidas. Estas variantes digitales fueron diseñadas para tener una secuencia de aminoácidos lo suficientemente distinta de la proteína original (la silvestre), pero con una estructura tridimensional y una función molecular similar, es decir, para que siguieran siendo peligrosas.

Y ahí es donde el BSS, optimizado para reconocer patrones y secuencias idénticas o muy parecidas a las de las listas de patógenos conocidos, falló. La GenAI, de hecho, crea homólogos (secuencias similares en función, pero distintas en el código) que se alejan tanto del patrón natural que el ‘centinela’ BSS simplemente los deja pasar por considerarlos ‘datos sintéticos’ inofensivos. Como señaló el CEO de Twist Bioscience, Emily M. Leproust, aunque las mejores prácticas para secuencias conocidas son robustas, «a medida que las capacidades de la IA evolucionan, las prácticas de cribado deben evolucionar igual de rápido».

¿Hacia una carrera armamentista biológica?

La principal preocupación de la comunidad científica, sin embargo, no es la creación accidental de una proteína dañina (aunque desde luego es un riesgo) sino la posibilidad de que algún actor malintencionado pueda utilizar el poder de la IA para diseñar y encargar un agente biológico con características optimizadas.

Como advierte Alfonso Valencia, lo primero que viene a la mente es «una variante más infecciosa del coronavirus». El peligro de la IA, por lo tanto, no es solo que se pueda crear una toxina, sino que sea posible diseñarla ‘ex novo’ para que sea más estable, más resistente a la degradación o más difícil de detectar por los sistemas inmunitarios. Y si el gen que codifica esa ‘super proteína’ pasa el cribado digital, la barrera entre lo que es mero diseño digital y la fabricación física de esa misma proteína desaparece.

Esta preocupación ha sido un tema central de la biología sintética desde hace tiempo. De hecho, el propio David Baker, junto con el famoso biotecnólogo George Church (pionero en ingeniería genética), ya había advertido de estos peligros en un editorial en ‘Science’ en enero de 2024. En él, los investigadores urgían para que se desarrollaran controles rigurosos y se crearan registros universales de todas las secuencias de ADN sintético fabricadas, lo cual daría una ‘pista’ para rastrear el origen de cualquier futura amenaza biológica.

Parches de software

Tras haber demostrado la vulnerabilidad, la respuesta inmediata de los investigadores de Microsoft y sus socios fue la de colaborar con los principales proveedores de BBS. Y, juntos, desarrollaron y desplegaron una serie de ‘parches de software’ que mejoraron ‘enormemente’ las tasas de detección de las variantes generadas por la IA. Sin embargo, ninguna de las herramientas logró una cobertura completa, y alrededor del 3% de las variantes con más probabilidades de seguir siendo peligrosas aún escaparon a la detección. Según el artículo, el problema de fondo sigue sin resolverse.

La fragilidad intrínseca del sistema llevó a los autores a tomar una decisión muy poco habitual y que resulta tan drástica como reveladora: restringir el acceso a parte de los datos y el código de su estudio, delegando su gestión a la Iniciativa Internacional de Bioseguridad y Biocustodia para la Ciencia (IBBIS). Los interesados deben solicitar acceso, identificarse y justificar su uso, sujetos a un comité de evaluación.

Para Alfonso Valencia, esta medida es, irónicamente, una «prueba más de la debilidad de este tipo de aproximaciones» y de la enorme dificultad para controlar lo que producen los métodos de GenAI. Si los propios científicos deben ocultar sus hallazgos para evitar una carrera armamentista, queda claro que las salvaguardas actuales son del todo insuficientes.

Las conclusiones del estudio apuntan al futuro: el cribado basado únicamente en la secuencia del gen ha quedado obsoleto y resulta cada vez menos efectivo, ya que la IA pronto diseñará proteínas sin parangón en la naturaleza. Por eso, los siguientes pasos deben pasar, según los autores, por el desarrollo de nuevos enfoques que no solo miren el código, sino su función potencial, quizás mediante ‘espacios de incrustación’ que permitan a la IA predecir la estructura 3D y el peligro intrínseco de una molécula totalmente nueva.

La IA, el espejo en el que se mira el futuro de la medicina y la sostenibilidad, ha puesto en nuestras manos un poder casi tan vasto como el de la creación. Y ahora, la tarea más urgente no es seguir creando máquinas moleculares perfectas, sino diseñar un sistema ético y de vigilancia que garantice que este nuevo ‘genio de la lámpara’ se invoque sólo para mejorar la salud y el bienestar, y no para aumentar el sufrimiento y la destrucción. La carrera entre el avance científico y la seguridad acaba de entrar en una nueva y peligrosa era.