La inteligencia artificial de Google predice la estructura de todas las proteínas conocidas y abre un nuevo universo para la ciencia
Un algoritmo resuelve uno de los mayores problemas de la biología actual al calcular la forma de 200 millones de moléculas, algunas de ellas esenciales para entender enfermedades devastadoras como el alzhéimer o el párkinson
Una inteligencia artificial propiedad de Google ha predicho la estructura de casi todas las proteínas conocidas; unos 200 millones de moléculas esenciales para comprender la biología de todos los seres vivos del planeta y los mecanismos de algunas de las enfermedades más prevalentes, desde la malaria hasta el alzhéimer y el cáncer.
“Este trabajo da inicio a una nueva era de biología digital”, ha celebrado Demis Hassabis, el experto en programación y neurociencia de 45 años que es el principal creador de ...
Una inteligencia artificial propiedad de Google ha predicho la estructura de casi todas las proteínas conocidas; unos 200 millones de moléculas esenciales para comprender la biología de todos los seres vivos del planeta y los mecanismos de algunas de las enfermedades más prevalentes, desde la malaria hasta el alzhéimer y el cáncer.
“Este trabajo da inicio a una nueva era de biología digital”, ha celebrado Demis Hassabis, el experto en programación y neurociencia de 45 años que es el principal creador de AlphaFold, el sistema de redes neuronales que ha sido capaz de resolver casi por completo uno de los mayores problemas de la biología.
El británico Hassabis fue un talento juvenil del ajedrez y los videojuegos que en 2010 fundó Deepmind, una empresa volcada en crear una inteligencia artificial capaz de aprender como los humanos. En 2013, este sistema demostró ser mejor que cualquier persona jugando a videojuegos de la empresa Atari. Al año siguiente, Google compró la compañía por unos 500 millones de euros. En 2017, AlphaGo arrasó ante los mejores campeones de Go, el complejísimo juego de tablero asiático similar al ajedrez. Desde entonces, Hassabis volcó sus esfuerzos en un reto mucho mayor: predecir la forma tridimensional que tendrá una proteína leyendo únicamente su secuencia genética, escrita en dos dimensiones con letras de ADN.
Conocer la estructura tridimensional de estas moléculas a partir de su secuencia genética es esencial para entender su función, pero supone un problema de inmensa dificultad. Es como terminar un puzle con decenas de miles de piezas sin saber qué imagen representa.
Hasta la aparición de este sistema, dilucidar la forma de una sola proteína compuesta por 100 unidades básicas —llamadas aminoácidos— podía llevar 13.700 millones de años, la edad del universo. En el mejor de los casos, los científicos tardaban años usando microscopía electrónica o enormes aceleradores de partículas como el sincrotrón europeo de Grenoble (Francia). En cambio, el algoritmo de Google predice la estructura de cualquier proteína en unos pocos segundos.
“Este universo de proteínas” es “un regalo para la humanidad”, ha resaltado Hassabis durante la presentación de la nueva base de datos, durante una rueda de prensa celebrada el martes, junto a científicos del Laboratorio Europeo de Biología Molecular (EMBL), una institución pública que ha colaborado en el desarrollo de AlphaFold.
Antes de la llegada de esta tecnología, se había conseguido determinar la estructura de unas 200.000 proteínas, una labor que llevó 60 años y la participación de miles de científicos. Esa base de datos ha sido el material de aprendizaje de la inteligencia artificial de Google, que ha buscado patrones válidos que predigan qué forma tendrán las proteínas de las que solo se conoce su secuencia bidimensional. En 2021, el sistema ya resolvió la estructura de un millón de proteínas, incluidas todas las humanas. La nueva remesa de este año amplía el récord a 200 millones: prácticamente todas las proteínas conocidas de todos los seres vivos del planeta.
El acceso a esta nueva base de datos es libre y gratuito y el código informático de su inteligencia artificial es abierto y descargable. Este Google de la vida muestra la secuencia bidimensional de cualquier proteína y un modelo tridimensional que indica el nivel de fiabilidad de la predicción, que tiene un margen de error similar o incluso menor que los métodos convencionales.
Es importante tener en cuenta que AlphaFold no determina la realidad, sino que la predice. Lee la secuencia genética y estima cuál es la forma más probable en la que se configurarán los aminoácidos. La predicción tiene una alta fiabilidad, lo que permite ahorrar mucho tiempo y dinero a los científicos para hacer trabajos teóricos sin necesidad de usar costosos equipos para determinar la estructura real de una proteína hasta que sea absolutamente necesario.
Las aplicaciones de esta nueva herramienta son casi infinitas, pues las proteínas microscópicas están involucradas en cualquier proceso biológico imaginable, desde la muerte en masa de las abejas a la resistencia de las cosechas al calor, pasando por una infinidad de enfermedades.
El equipo de Matt Higgins, de la Universidad de Oxford (Reino Unido), ha usado AlphaFold como parte de su proyecto para desarrollar un anticuerpo —un tipo de proteína— capaz de neutralizar una de las proteínas esenciales para que el patógeno de la malaria pueda reproducirse. Dentro de años, este tipo de investigaciones podrían conseguir la primera vacuna altamente protectora contra esta enfermedad, pues impediría la transmisión del parásito de una persona a otra a través de la picadura de mosquitos.
Logros conseguidos
Otro de los hitos ya logrados es la estructura más detallada hasta la fecha de los poros nucleares, un complejo de proteínas con forma de rosquilla que es la puerta de entrada y de salida del núcleo de las células humanas y que está relacionado con un sinfín de enfermedades, incluidas el cáncer y las cardiovasculares. Esta nueva herramienta permite un acceso sin precedentes a entender “cómo la receta de la vida [escrita en el genoma] entra en funcionamiento al traducirse en proteínas”, explicó a este diario Jan Kosinski, investigador del EMBL coautor de este hallazgo.
Hassabis y el resto de responsables de Deepmind y el EMBL han asegurado que se han analizado los posibles riesgos que entraña publicar esta base de datos y hacerla accesible a todo el mundo. “Los beneficios son claramente superiores a las amenazas”, ha resaltado el creador del sistema, que ha añadido que en el futuro, a medida que se desarrolle esta tecnología, será la comunidad internacional la que deba decidir si debe limitarse su uso.
Una de las aplicaciones más tangibles es el diseño de moléculas a la carta que puedan bloquear proteínas nocivas o, mejor, modular su actividad, un efecto mucho más deseable en el diseño de nuevos fármacos, explica Carlos Fernández, científico del CSIC y líder del grupo de biología estructural de la Sociedad Española de Biología Molecular. Su equipo ha utilizado AlphaFold para dilucidar parte de la estructura de un complejo formado por varias proteínas esencial para la propagación del tripanosoma que causa la enfermedad del sueño que existe en países del África subsahariana.
Ahora quedan por delante años de trabajo para confirmar si las predicciones son correctas, explica el biólogo José Márquez, experto en estructura de proteínas del sincrotrón de Grenoble. “La próxima frontera será que AlphaFold pueda contribuir al diseño de fármacos bloqueadores de proteínas o activadores de ellas, un problema que ya están abordando”, explica. Otro escollo: el sistema no dice por qué una proteína obtiene su forma final, algo que puede ser esencial en la investigación de dolencias como el alzhéimer o el párkinson, relacionadas con un plegado incorrecto de las proteínas.
Alfonso Valencia, director de ciencias de la vida en el Centro Nacional de Supercomputación, habla de las carencias del sistema. “No todo está resuelto, porque AlphaFold solo puede predecir cosas que estén en el dominio de cosas conocidas. Por ejemplo, no puede predecir bien la estructura de un tipo de proteínas que protegen de congelación porque son raras y no hay muchos ejemplos en las bases de datos. Tampoco puede predecir la consecuencia de mutaciones, lo que es un punto muy negativo en medicina”, resalta.
También reconoce uno de sus puntos fuertes: que el código de todo el sistema es abierto, lo que supone que otros científicos pueden mejorarlo o modificarlo a su gusto, incluso si Google decide retirar el sistema de la red. “Es evidente que la gente de Deepmind está buscando ganar el Premio Nobel al actuar de esta forma tan transparente”, opina Valencia. “Por un lado, obtienen una gran imagen y una ventaja sobre sus competidores, como Facebook. Por otro, ya han sugerido que se reservan el uso privado de datos concretos sobre salud y para el diseño de fármacos”, añade.
Puedes seguir a MATERIA en Facebook, Twitter e Instagram, o apuntarte aquí para recibir nuestra newsletter semanal.