El código abierto de software de estructura de proteínas ya está dando sus frutos

, Forma parte de la Historia

Humphreys y. Alabama.

Ahora es relativamente trivial determinar el orden de los aminoácidos en una proteína. Sin embargo, descubrir cómo ese orden se traduce en una estructura tridimensional complicada que realiza una función específica es extremadamente desafiante. Pero después de décadas de lento progreso, el grupo de inteligencia artificial DeepMind de Google anunció que ha hecho grandes avances hacia la solución del problema. En julio, el sistema, llamado AlphaFold, se convirtió en código abierto. Al mismo tiempo, un grupo de investigadores académicos lanzó su propio software de plegado de proteínas, llamado RoseTTAFold, construido en parte utilizando ideas derivadas del trabajo de DeepMind.

¿Qué tan efectivas son estas herramientas? Incluso si no son tan buenos como sugieren algunas de las estadísticas, está claro que son mucho mejores que cualquier cosa que hayamos tenido. Entonces, ¿cómo los usarán los científicos?

Esta semana, una gran colaboración de investigación liberó al software en un problema relacionado: cómo estas estructuras tridimensionales individuales se unen para formar los grandes complejos de múltiples proteínas que realizan algunas de las funciones más importantes en biología.

Más allá de 3D

Muchas proteínas individuales funcionan bien por sí solas, pero algunos aspectos de la biología requieren la coordinación cuidadosa de múltiples cambios químicos realizados como una serie de pasos secuenciales ordenados. Y para esos procesos, a menudo es más fácil que las proteínas que necesitan coordinarse formen parte de un solo complejo. Por ejemplo, el complejo que hace copias de nuestros cromosomas generalmente consta de más de una docena de proteínas. El fotosistema I, parte del proceso fotosintético de las plantas, tiene una escala similar. El ribosoma, que traduce la información de los ARN mensajeros en la secuencia de aminoácidos de las proteínas, puede requerir más de 75 proteínas en algunas especies.

Poner estos y otros complejos juntos requiere el plegado adecuado de las proteínas que los componen en las formas tridimensionales correctas, el problema para el que AlphaFold y RoseTTAFold fueron diseñados para resolver. Sin embargo, una vez que se realiza ese plegamiento, las proteínas tienen que interactuar entre sí, encajando en la orientación correcta y estabilizando estas interacciones a través de contactos entre sus aminoácidos (lo que significa que una carga positiva en una proteína se correspondería con una carga negativa en su socio, etc.).

Hasta cierto punto, la información obtenida de AlphaFold y RoseTTAFold debería ser útil para esta aplicación, porque resolver las estructuras individuales de las proteínas debería decirnos algo sobre las superficies que podrían interactuar. Pero los métodos utilizados por los algoritmos resultaron ser específicamente útiles para ensamblar complejos de múltiples proteínas.

RoseTTAFold, por ejemplo, resuelve las estructuras de proteínas en parte cortando su secuencia de aminoácidos en trozos más pequeños y resolviendo cada uno de ellos antes de ensamblarlos en una proteína más completa. Pero los creadores del sistema descubrieron que si a RoseTTAFold se le dieran piezas de dos proteínas diferentes que interactúan, felizmente ensamblaría ambas proteínas de una manera que también capturaría sus interacciones, incluida la orientación y el espaciado correctos.

La evolución da y quita

La otra característica útil es que ambos algoritmos se apoyan en gran medida en la evolución para realizar sus predicciones estructurales. Un paso clave para cada uno es identificar muchas proteínas que están relacionadas por descendencia común y es probable que compartan una estructura común. Estas proteínas proporcionan limitaciones importantes sobre las estructuras que son posibles dentro de una familia dada de secuencias relacionadas. Ciertos aminoácidos interfieren con la formación de estructuras helicoidales, por ejemplo.

Los complejos de proteínas pueden enfrentar limitaciones similares, pero hay una diferencia importante. Digamos que la proteína A tiene un aminoácido con una carga positiva que interactúa con uno negativo en la proteína B. Si una mutación cambia A para que ahora tenga una carga negativa, la interacción entre los dos se debilitaría enormemente. Pero la proteína B podría compensar ese problema si una mutación cambiara su carga negativa por una positiva.

Seguir pares de proteínas a medida que cambian a lo largo de la evolución puede proporcionar una indicación de si los cambios en una se compensan con los cambios en la otra. La ausencia de este tipo de cambios puede indicarnos que es poco probable que las proteínas interactúen.

Para mantener el análisis computacionalmente manejable, los investigadores simplemente emparejaron cada proteína con todo lo demás en el genoma. Encontraron interacciones por pares y luego usaron esas interacciones para construir complejos más grandes. Sin embargo, incluso conociendo los posibles pares de interacciones, dejaron complejos que se limitaron a un pequeño número de proteínas; e intentar construir algo tan grande como la ADN polimerasa habría abrumado el hardware computacional al que tenían acceso los investigadores.

Te puede interesar  Conozca este teléfono Android compacto y único de una empresa japonesa de tostadoras

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *