Una empresa de IA genera en el laboratorio 500 millones de años de evolución hasta dar con una proteína fluorescente artificial
Una ‘startup’ creada por antiguos investigadores de Meta crea un camino evolutivo alternativo usando el mayor poder de computación jamás utilizado en biología, según la compañía
Los científicos se preguntan si la evolución podría haber transcurrido por otro camino diferente. Por ejemplo, si era inevitable que surgiese el ser humano, o si somos el producto de una serie de carambolas naturales que podría no haber sucedido, dando como resultado un mundo alternativo. No hay una respuesta definitiva, pero hoy la inteligencia artificial (IA) puede emprender experimentos evolutivos. Uno de ellos, publicado esta semana en la revista Science, revela que en el diseño de un tipo de proteína hubo otras rutas posibles que la naturaleza no exploró. Y esta tecnología puede aportar valiosas pistas en la creación de nuevas terapias y otras aplicaciones.
En su libro de 1989 La vida maravillosa, el biólogo evolutivo Stephen Jay Gould planteaba un experimento mental: si la cinta de la evolución de la vida terrestre pudiese rebobinarse para volver al principio y comenzar de nuevo, ¿el resultado sería el mismo que conocemos, o bien otro completamente diferente? Gould argumentaba a favor de lo segundo: en una nueva partida, empleando el símil de los videojuegos, la evolución habría tomado otro derrotero muy distinto y los humanos no existiríamos. “Vuelve a reproducir la cinta un millón de veces… y dudo que algo como el Homo sapiens pudiese evolucionar de nuevo”, escribía.
La tesis de Gould ha sido ampliamente debatida desde entonces, con opiniones a favor del determinismo y otras que defienden la contingencia. En su cuento de 1952 El ruido de un trueno, el autor de ciencia ficción Ray Bradbury narraba cómo un viajero en el tiempo que pisaba una mariposa en la época de los dinosaurios cambiaba el rumbo del futuro. Gould expresaba esta misma idea: “Altera cualquier acontecimiento temprano, incluso de forma muy leve y sin aparente importancia entonces, y la evolución fluye a un canal totalmente distinto”.
Hablar el lenguaje de las proteínas
Los científicos han indagado en este problema mediante experimentos que tratan de recrear la evolución en el laboratorio o en la naturaleza, o bien comparando especies que han surgido en condiciones similares. Hoy existe una nueva vía: la IA. En Nueva York, un grupo de antiguos investigadores de Meta —la compañía matriz de redes sociales como Facebook, Instagram y WhatsApp— fundó EvolutionaryScale, una startup de IA enfocada a la biología. El sistema ESM3 (EvolutionaryScale Model 3), creado por esta empresa, es un modelo generativo de lenguaje; el tipo de plataforma al que pertenece el archiconocido ChatGPT, pero ESM3 no genera textos, sino proteínas, los ladrillos fundamentales de la vida.
ESM3 se alimenta de datos de secuencia, estructura y función de proteínas existentes para aprender el lenguaje biológico de estas moléculas y crear otras nuevas. Sus creadores lo han entrenado con 771.000 millones de paquetes de datos creados a partir de 3.150 millones de secuencias, 236 millones de estructuras y 539 millones de rasgos funcionales, sumando un total de más de un billón de teraflops (una medida del rendimiento computacional), el mayor poder de computación jamás utilizado en biología, según la propia compañía.
“ESM3 da un paso hacia un futuro de la biología, donde la IA es una herramienta para construir desde los primeros principios, del modo que construimos estructuras, máquinas y microchips”, afirma el cofundador y jefe científico de EvolutionaryScale y director del nuevo estudio, Alexander Rives. Su visión es que la biología es la tecnología más avanzada jamás creada y que es programable, ya que utiliza un alfabeto común, el código genético que se traduce en los aminoácidos, eslabones de las proteínas. “ESM3 entiende todos estos datos biológicos, los traduce y los habla con fluidez para usarlos como herramienta generativa”.
La proteína que no fue
Rives y sus colaboradores han aplicado ESM3 al problema de crear una nueva proteína fluorescente verde (GFP, por sus siglas en inglés). La GFP es una proteína natural que brilla en verde bajo la luz ultravioleta, y que se usa en investigación como marcador. La primera se descubrió en una medusa, pero existen otras versiones en corales o anémonas. Los científicos entrenaron a ESM3 para crear una nueva GFP, y el resultado les sorprendió: una proteína fluorescente, a la que han llamado esmGFP, que solo se parece en un 58% a la más similar, lo que según los investigadores equivale a simular 500 millones de años de evolución. ESM3 está ahora a disposición de la comunidad científica como una nueva herramienta para el diseño de nuevas proteínas con funciones terapéuticas, de remediación ambiental y otros usos.
Así, la IA ha encontrado un nuevo camino que la naturaleza pudo haber emprendido hace 500 millones de años, pero que, por razones que desconocemos, ignoró. Rives y sus colaboradores explican que solo unas pocas mutaciones de la GFP pueden destruir la fluorescencia; y que, sin embargo, ESM3 ha encontrado un nuevo espacio de proteínas fluorescentes que podían haber sido, pero que no fueron: “Bajo estas secuencias existe un lenguaje fundamental de la biología de las proteínas que puede entenderse usando modelos de lenguaje”.
Según Jonathan Losos, profesor de la Universidad de Washington que trabaja en la cuestión del rebobinado de la evolución estudiando especies en la naturaleza, “este estudio es un brillante ejemplo de que existen muchas maneras en que la evolución podría haber procedido”. Losos valora los resultados del trabajo como una confirmación de la contingencia defendida por Gould. Así lo contempla también Zachary Blount, profesor de la Universidad Estatal de Michigan que mostró la contingencia de la evolución en un famoso experimento de cultivo de bacterias iniciado en 1988 por su antiguo supervisor, Richard Lenski, y que aún continúa después de más de 80.000 generaciones.
“El estudio muestra que hay posibilidades biológicas viables que no han evolucionado (creemos) en la Tierra, lo que sugiere caminos genuinos que la evolución pudo tomar, pero no lo hizo porque la historia necesaria no ocurrió”, comenta Blount, advirtiendo de que también existe algo de determinismo en la naturaleza; en el experimento de ESM3 hay un 42% de semejanza con otras GFP. Blount no cree que la IA acabe de zanjar el problema del rebobinado, pero sí que ayudará a entender qué es contingente, qué no y por qué: “Nos proporciona maneras de sondear la esfera de las posibilidades biológicas, lo que nos permite comparar lo que es biológicamente posible con lo que existe o ha existido”.