Newsletter DPT Nro. 95/97 - Abril/Junio
ISSN 2618-236X
Abril-Junio / 2024
NOTICIAS CIENTIFICAS
NOTICIAS CIENTIFICAS INTERNACIONALES
Proteínas: Avances en la predicción, creación y mapeo de interacciones con otras biomoléculas
Esta reseña comprende dos artículos. El primero (1) trata sobre el software de IA AlphaFold 3, que mapea -en minutos- cualquier interacción de proteínas con biomoléculas como el ADN y el ARN. En el segundo (2) se presenta un método para crear proteínas con aminoácidos “exóticos”.
1.- Primer artículo: AlphaFold 3: Un potente software de IA que mapea -en minutos- cualquier interacción de proteínas con biomoléculas como el ADN y el ARN (1.1.) (1.2.) (1.3.) (1.4.) (1.5.) (1.6.) (1.7.) (1.8.)
AlphaFold es un sistema avanzado de inteligencia artificial (IA) desarrollado por Google DeepMind (*) (**). Desde su desarrollo, hace poco más de 3 años, el modelo AlphaFold 2 (AF2) revolucionó la predicción de la estructura de las proteínas (cómo se pliegan las cadenas de aminoácidos en estructuras tridimensionales), abriendo numerosas oportunidades para la investigación biológica y aplicada. Sus aplicaciones se extienden desde el desarrollo de nuevos antibióticos a la identificación de nuevos métodos para administrar fármacos o de dianas de precisión para tratar el cáncer. Por su parte, AlphaFold-Multimer permitía la predicción de complejos proteína-proteína. La estructura es una parte esencial para la función de las proteínas, pero éstas interactúan con otras proteínas y con moléculas como el ADN o el ARN en sistemas que pueden alcanzar una gran complejidad. Por lo tanto, para entender cómo funcionan las proteínas y utilizar ese conocimiento en aplicaciones médicas o biotecnológicas es crucial conocer también cómo interactúan con otras moléculas.
El 8 de mayo, Google Deepmind e Isomorphic Labs presentaron la última versión del modelo de IA, AlphaFold 3 (AF3), junto con la publicación de un trabajo en Nature que describe la herramienta. El AF3 amplía su capacidad predictiva y abarca una gama más amplia de moléculas biológicas: además de predecir estructuras de proteínas, estima la forma en que éstas interactúan con otros tipos de moléculas. Permite a los investigadores observar los sistemas celulares en toda su complejidad, a través de estructuras, interacciones y modificaciones, así como comprender cómo éstas influyen en las funciones biológicas.
De predecir proteínas a predecir sistemas de interacciones
Los expertos en el campo de la predicción de proteínas señalan que AF3 marca un avance significativo con respecto a programas anteriores, como AF2 y RoseTTAFold All-Atom. A partir de una lista de moléculas, AF3 modela en 3D complejos de proteínas con otras proteínas, ADN, ARN y moléculas pequeñas como los ligandos. También predice interacciones anticuerpo-antígeno o modificaciones químicas de proteínas. En conjunto, AF3 permite predecir los complejos e interacciones que implican a prácticamente todos los tipos moleculares incluidos en Protein Data Bank.
Aplicaciones en el diseño de fármacos
Una de las aplicaciones más directas y destacables de AF3 reside en el diseño de fármacos, ya que proporciona a los diseñadores la capacidad de predecir con rapidez y precisión la estructura de complejos que nunca se habían caracterizado, así como de adoptar nuevos enfoques en el diseño. Ahora pueden crearse y probarse hipótesis a nivel atómico, y producir predicciones de estructura muy precisas en cuestión de segundos, lo que contrasta con los meses, o incluso años, requeridos para responder experimentalmente a preguntas similares. Por ejemplo, permite acelerar el diseño de moléculas pequeñas que se unan a sitios específicos de proteínas objetivo y puedan modificar su función. También abre nuevas posibilidades en el desarrollo de fármacos basados en anticuerpos u otras proteínas terapéuticas. Por último, la predicción de las interacciones de proteínas con moléculas como ARN o ADN amplía también el tipo de dianas terapéuticas a considerar en el desarrollo de fármacos más efectivos para la clínica. Un ejemplo del referido potencial es la predicción de interacción entre moléculas pequeñas y la proteína TIM3 (objetivo para la inmunoterapia del cáncer). A través de AF3 los investigadores detectaron una región de esta proteína no identificada previamente, con la que interactúan los ligandos y a la que podría dirigirse el diseño de fármacos.
Aplicaciones en enfermedades genéticas
Con base en la predicción de estructuras de complejos moleculares, AF3 ofrece nuevas vías para entender cómo afectan las mutaciones genéticas a la estructura y función de las proteínas. En materia de diagnóstico, podría facilitar la interpretación de la patogenicidad de variantes genéticas raras o desconocidas. Además, podría facilitar la identificación y caracterización de las conformaciones estructurales de las proteínas afectadas por mutaciones patogénicas, con efectos importantes para la salud. Al estimar cómo alteran estas mutaciones la estructura proteica, sería posible desarrollar moléculas pequeñas que estabilicen la forma correcta de la proteína o que modifiquen la interacción patológica de proteínas mal plegadas con otras moléculas en la célula. Asimismo, al permitir explorar interacciones proteína-ADN y proteína-ARN, amplía la posibilidad de conocer mejor mecanismos implicados en enfermedades susceptibles de intervención farmacológica e identificar nuevas dianas terapéuticas. Podría contribuir, además, a mejorar el diseño de terapias de edición genómica que requieren interacción entre proteínas y ácidos nucleicos, para tratar diferentes enfermedades genéticas.
La herramienta también puede incorporar los efectos de modificaciones “postraduccionales” de las proteínas terminadas, así como cambios en el ADN y el ARN conocidos como marcadores epigenéticos. Eso debería permitirle predecir cómo estos ajustes bioquímicos alteran las funciones de las proteínas, causando en algunos casos enfermedades. Esas predicciones podrían, a su vez, ayudar a desarrollar medicamentos para prevenir o revertir estos cambios.
Servidor exclusivo para uso no comercial
Según DeepMind, desde la publicación de AF2 (en 2021) 1,8 millones de investigadores lo han utilizado para mapear unos 6 millones de estructuras proteicas con diversos objetivos, desde la mejora de cultivos al desarrollo de fármacos para la medicina de precisión. Actualmente, la base de datos AlphaFold DB, creada por Google DeepMind y el Instituto Europeo de Bioinformática, incluye más de 200 millones de predicciones de estructura de proteínas. Sin embargo, la herramienta padece aún de limitaciones como errores en la quiralidad de las estructuras (una propiedad de las moléculas importante a nivel funcional) o la limitada predicción de algunas estructuras secundarias. Para mejorar las predicciones y evitar “alucinaciones” (predicciones plausibles, pero no realistas) que se generan con las técnicas de difusión utilizadas, los desarrolladores señalan que será necesario generar grandes conjuntos de predicciones y ordenarlas en función de la estructura obtenida.
Para facilitar la utilización de AF3, Google DeepMind lanzó AlphaFold Server, una plataforma en línea gratuita, accesible a investigadores de todo el mundo, que permite a los usuarios -con fines no comerciales- crear modelos AF3 de proteínas que interactúan con casi cualquier otra biomolécula. El servidor permite a los usuarios ingresar la secuencia de aminoácidos de interés junto con la secuencia de ácido nucleico de una cadena de ADN o ARN o la fórmula de un fármaco de moléculas pequeñas. En cuestión de minutos, el software genera imágenes de cómo probablemente interactúan, así como puntuaciones de confianza que califican la probabilidad de que el modelo sea correcto.
Ver artículos vinculados publicados en Newsletter DPT:
(*) “Proteínas diseñadas y desarrolladas por Inteligencia Artificial: para desempeñar funciones no cubiertas en la evolución natural” Newsletter DPT Nro. 88-90. Septiembre-Noviembre 2023
(**) “Es posible inferir la estructura de casi todas las proteínas conocidas por la ciencia: con herramientas de Inteligencia Artificial” Newsletter DPT Nro. 76. Septiembre 2022
2.- Segundo artículo: Un método eficiente para crear proteínas con aminoácidos “exóticos”: Su potencial para el desarrollo de nuevos medicamentos y catalíticos (2.1.) (2.2)
El ADN codifica sólo 20 aminoácidos, los componentes básicos de todas las proteínas de la vida. Si bien los investigadores desearían construir proteínas a partir de cientos de aminoácidos “exóticos” (no utilizados por la vida), la preferencia por la maquinaria celular de producción de proteínas ha obstaculizado –hasta hoy- el intento de utilizar otras posibilidades. En el artículo aquí reseñado un equipo de investigadores del MRC Laboratory of Molecular Biology (LMB, Cambridge, Reino Unido), liderado por Jason Chin, informa haber desarrollado una forma eficaz de “convencer” a ciertas bacterias para que agreguen aminoácidos estructuralmente inusuales a las proteínas. Hasta ahora han tenido éxito con sólo 4 elementos básicos “exóticos”, pero su enfoque podría conducir a medicamentos que persistan más tiempo en el cuerpo y mejores catalizadores para la industria.
Lograr que una célula produzca cualquier tipo de proteína implica dos pasos clave: (a) transportar aminoácidos al ribosoma (el ensamblador de proteínas de la célula), y (b) incitar al ribosoma para que los una a una proteína en crecimiento. La entrega de aminoácidos es tarea de fragmentos cortos de ARN llamados ARN de transferencia (ARNt). Cada ARNt tiene una secuencia genética de tres letras que codifica un aminoácido específico. Las enzimas conocidas como aminoacil tRNA sintetasas (aaRS) unen el aminoácido adecuado a cada tRNA. Los ARNt cargados luego viajan al ribosoma, donde se unen a las secuencias correspondientes en una larga cadena del llamado ARN mensajero (ARNm), que contiene una copia completa de un gen que se traducirá en una proteína. El ribosoma desciende por la hebra de ARNm, arrancando aminoácidos y enlazándolos en una cadena en crecimiento.
Para producir nuevas proteínas, los investigadores deben lograr que ambos pasos (la carga y el enlace) funcionen correctamente, Chin y sus colegas han encontrado una mejor manera de dar el primer paso. Al mutar genes de las enzimas aaRS, crearon millones de versiones alternativas que podrían unirse a aminoácidos exóticos. También etiquetaron cada ARNt con una secuencia de ARNm de las enzimas alteradas capaces de cargar los aminoácidos y rastrearon cuáles funcionaron entre la mezcla de millones. Luego insertaron genes para estas enzimas en la bacteria Escherichia coli y observaron si sus ribosomas podían incorporar con éxito esos exóticos aminoácidos en proteínas. Encontraron 4 enzimas que cargaron con éxito aminoácidos exóticos, y los ribosomas naturales de E. coli pudieron incorporar 4 en cadenas de proteínas en crecimiento: 3 aminoácidos beta y una variedad igualmente exótica conocida como aminoácido alfa-alfa.
Aunque sólo se trata de una prueba de principio, es probable que el logro tenga relevantes implicaciones futuras. El enfoque debería ayudar a las empresas a diseñar medicamentos basados en proteínas resistentes a las enzimas del cuerpo que degradan fácilmente las proteínas basadas en alfa aminoácidos, reduciendo la necesidad de dosis repetidas. Y debido a que los aminoácidos exóticos tienen formas diferentes a las versiones estándar, el enfoque también podría mejorar los catalizadores industriales involucrados en la fabricación de diversos productos, desde farmacéuticos hasta combustibles. El proceso acelerado todavía depende de la “voluntad” del ribosoma de aceptar ocasionalmente aminoácidos inusuales. Por eso, el equipo también está trabajando para alterar al propio ribosoma, realizando mutaciones sistemáticas que le permitan reconocer códigos de ARNt que no se encuentran en la naturaleza y tolerar aminoácidos con formas inusuales. A medida que se unen las líneas de investigación de carga y enlace, Chin señala que los avances podrían permitir a su equipo diseñar bacterias para producir materiales poliméricos -similares a proteínas- completamente nuevos, compuestos enteramente por aminoácidos exóticos Esta posibilidad abre todo un espacio de polímeros sintéticos que podría utilizarse “para complementar la biología”.
Referencias:
(1.1.) Fuente primaria: “Accurate structure prediction of biomolecular interactions with AlphaFold 3” Josh Abramson, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Andrew J. Ballard, Joshua Bambrick, Sebastian W. Bodenstein, David A. Evans, Chia-Chun Hung, Michael O’Neill, David Reiman, Kathryn Tunyasuvunakool, Zachary Wu, Akvilė Žemgulytė, Eirini Arvaniti, Charles Beattie, Ottavia Bertolli, Alex Bridgland, Alexey Cherepanov, Miles Congreve, Alexander I. Cowen-Rivers, Andrew Cowie, Michael Figurnov, Fabian B. Fuchs, Hannah Gladman, Rishub Jain, Yousuf A. Khan, Caroline M. R. Low, Kuba Perlin, Anna Potapenko, Pascal Savy, Sukhdeep Singh, Adrian Stecula, Ashok Thillaisundaram, Catherine Tong, Sergei Yakneen, Ellen D. Zhong, Michal Zielinski, Augustin Žídek, Victor Bapst, Pushmeet Kohli, Max Jaderberg, Demis Hassabis & John M. Jumper. Nature. 08 May 2024. DOI: 10.1038/s41586-024-07487-w
(1.2.) Fuente secundaria 1: “Alphafold 3.0: the AI protein predictor gets an upgrade: Deepmind’s protein-structure predictor adds other molecules to the mix, and a big step towards a ‘nuclear clock’” By Benjamin Thompson & Nick Petrić Howe. Nature. 08 May 2024
(1.3.) Fuente secundaria 2: “Major AlphaFold upgrade offers boost for drug discovery: Latest version of the AI models how proteins interact with other molecules — but DeepMind restricts access to the tool” By Ewen Callaway. Nature. 08 May 2024
(1.4.) Fuente secundaria 3: “Powerful new AI software maps virtually any protein interaction in minutes: Predicting how proteins bind to other molecules could revolutionize biochemistry, drug discovery” By Robert F. Service. Science. News Technology. © 2024 American Association for the Advancement of Science. 8 May 2024. DOI: 10.1126/science.zeb9y2s
(1.5.) Fuente secundaria 4: “AlphaFold 3 abre nuevas oportunidades para la genética clínica y desarrollo de fármacos: predice la estructura e interacciones de proteínas con otras moléculas como el ADN y el ARN”. Por Amparo Tolosa, Genotipia. mayo 16, 2024
(1.6.) Fuente complementaria: “Limits on access to DeepMind’s new protein program trigger backlash: Critics accuse Nature, which published the research, of failing to meet its own transparency standards” By Catherine Offord. Science. Science Insider Biology. 15 May 2024. DOI: 10.1126/science.znxeyt5
(1.7.) Acceso al servidor: AlphaFold Server: Powered by AlphaFold 3
(1.8.) Presentación por DeepMind: AlphaFold is accelerating research in nearly every field of biology. DeepMind
(2.1.) Fuente primaria: “Adding α,α-disubstituted and β-linked monomers to the genetic code of an organism” Daniel L. Dunkelmann, Carlos Piedrafita, Alexandre Dickson, Kim C. Liu, Thomas S. Elliott, Marc Fiedler, Dom Bellini, Andrew Zhou, Daniele Cervettini & Jason W. Chin. Nature (2024). Article. Open access. 10 January 2024. DOI:10.1038/s41586-023-06897-6
(2.2.) Fuente secundaria: “Bacteria stitch exotic building blocks into novel proteins: Efficient method for creating proteins with unusual amino acids opens the door to new medicines and catalysts” By Robert F. Service. Science. 11 Jan 2024 American Association for the Advancement of Science. DOI: 10.1126/science.z1y6y48