El Centro de Regulación Genómica (CRG) de Barcelona ha demostrado que los datos sobre estructura física (forma tridimensional) fusionados con los datos de secuencia genómica dan como resultado un conocimiento más perfecto (fiable) del árbol evolutivo (o filogenético) de las proteínas, que es algo necesario para poder esclarecer la historia antigua de la vida en la Tierra, monitorizar la propagación de patógenos o diseñar nuevas terapias contra el cáncer y otras enfermedades.
Además, ha desarrollado la metodología combinada para poder hacerlo, algo complejo dada la gran magnitud de datos de uno y otro aspecto que hay que manejar. El método se apoya en AlphaFold 2, un programa de inteligencia artificial desarrollado por DeepMind de Alphabet que realiza predicciones de la estructura de las proteínas mediante el sistema de aprendizaje profundo, y en Nextflow, un sistema de flujo de trabajo desarrollado por el propio CRG (Nature Biotechnology, 2017) como solución eficiente al dilema de la reproducibilidad en los análisis ómicos, según ha informado a este diario Cedric Notredame, investigador del CRG y autor principal del estudio.
Los resultados del trabajo (prueba de concepto y método usado), desarrollado a lo largo de diez años, se publican hoy en Nature Communications. Según ha destacado el CRG, el enfoque funciona incluso con la predicción de estructuras de proteínas que jamás se han determinado experimentalmente.
Y ha recordado que, por ahora, hay unas 210.000 estructuras de proteínas determinadas experimentalmente y hasta 250 millones de secuencias de proteínas conocidas, e iniciativas como el proyecto EarthBioGenome podrían generar miles de millones de secuencias de más en los próximos años. “Esa abundancia de datos abre la puerta a la aplicación del estudio en una escala sin precedentes”, ha subrayado.
El obstáculo de la saturación
Los árboles filogenéticos se construyen tradicionalmente comparando secuencias de ADN o proteínas, y contando las similitudes y diferencias para inferir relaciones. Sin embargo, el campo se enfrenta a un importante obstáculo: la saturación.
Se debe a que a lo largo de miles de años las secuencias genómicas pueden cambiar tanto que, cuando se estudian en la actualidad, ya no se asemejan a sus formas ancestrales.
via Noticias de diariomedico.... https://ift.tt/QAiMDzr
No hay comentarios:
Publicar un comentario