Un consorcio internacional de científicos publica hoy en Nature los resultados de la tercera fase del Proyecto Encode (Encyclopedia of DNA Elements). El medio millar de científicos del consorcio han realizado alrededor de 6.000 experimentos -4.834 en humanos y 1.158 en ratones- para identificar más de 900.000 candidatos a ser elementos reguladores del genoma humano y más de 300.000 del genoma del ratón. El estudio se complementa con otros 13 estudios adicionales publicados en otras revistas importantes.
Uno de ellos, en Genome Research, lo ha elaborado el equipo dirigido por Thomas Gingeras, del Cold Spring Harbor Laboratory en Estados Unidos, y Roderic Guigó, coordinador del Programa de Bioinformática y Genómica en el Centro de Regulación Genómica (CRG) de Barcelona. En él reclasifican las células del cuerpo humano en cinco grupos principales tras monitorizar el transcriptoma (conjunto de transcripciones de genes) de las células primarias en múltiples órganos.
“Hemos producido datos de secuenciación de ARN para 53 células primarias de diferentes ubicaciones en el cuerpo humano”, explican. “La agrupación de estas células primarias revela que la mayoría de las células del cuerpo humano comparten algunos programas transcripcionales amplios, que definen cinco tipos principales de células: epitelial, neuronal (equivalente a los grupos histológicos), sanguíneo (un tipo principal y no un subtipo del tipo conjuntivo), endotelial (también un tipo principal y no un subtipo del tipo epitelial) y mesenquimal (que agrupa al tejido muscular y al conectivo, menos la sangre). Actúan como componentes básicos de muchos tejidos y órganos. Sobre la base de la expresión génica, estos tipos de células redefinen los tipos histológicos básicos por los cuales los tejidos se han clasificado tradicionalmente”. Asimismo, han identificado genes cuya expresión es específica para estos tipos de células, y a partir de esos genes, han estimado la contribución de los principales tipos de células a la composición de los tejidos humanos.
“Esta composición celular es una firma característica de los tejidos y refleja la heterogeneidad e histología morfológica de los tejidos. Hemos identificado cambios en la composición celular en diferentes tejidos asociados con la edad y el sexo y hemos descubierto que las desviaciones de la composición celular normal se correlacionan con los fenotipos histológicos asociados con la enfermedad”.
Tradicionalmente, precisa Roderic Guigó a DM, “los tejidos humanos se clasifican en cuatro tipos distintos: epitelial, muscular, conectivo y neuronal. La sangre se considera un subtipo del tipo conectivo y el tipo endotelial un subtipo del tipo epitelial (aunque hay controversia sobre este asunto). Esta clasificación se basa sobre todo en la morfología y la función de las células que constituyen estos tejidos”.
Su trabajo ha consistido en analizar el patrón de expresión de genes en células de distintos órganos y comparar esos patrones en estas células. “Hemos visto que la mayoría, pero no todas, se agrupan en cinco grupos principales. Se definen porque las células dentro de uno de estos grupos tienen patrones de expresión génica globalmente similares”. Es decir, los cinco grupos celulares actúan como bloques de construcción fundamentales, a partir de los cuales se "ensamblan" los tejidos y órganos.
"Comprender cómo estos cinco grupos de células componen el tejido humano es un primer paso para ayudar a caracterizar la enfermedad", explica Manuel Muñoz Aguirre, investigador del CRG. “Por ejemplo, si estudiamos un grupo de individuos sanos, tenemos una idea de cómo se comportan las células en estos grupos. Luego, cuando estudiamos un grupo de individuos enfermos, podemos observar las diferencias en los niveles de estas células. Es un punto de partida para comprender qué podría salir mal durante la enfermedad a nivel celular".
Enciclopedia viva
El Proyecto Encode ha comenzado su cuarta fase con nuevas tecnologías e investigando tipos de células adicionales. "Esta enciclopedia es un recurso vivo”, añade Gingeras. "Tiene un principio, pero realmente no tiene fin. Seguirá mejorando y creciendo. Cuando completamos el primer borrador del genoma humano, quedó claro que, si bien teníamos la secuencia primaria del genoma, necesitábamos disponer de una anotación precisa. Sabíamos dónde estaban ubicados los genes, pero la ubicación de los mecanismos reguladores en el genoma estaba subdesarrollada".
El genoma humano contiene unos 20.000 genes codificadores de proteínas, pero las partes funcionantes de nuestros genes representan sólo alrededor del 2% de todo el genoma. Durante las últimas dos décadas, los científicos han estado tratando de averiguar lo que hace el otro 98%, el mal llamado ADN basura.
Financiado por el National Human Genome Research Institute (NHGRI) estadounidense, Encode arrancó en 2003, poco después de la primera secuenciación completa del genoma humano. Sus investigadores han estado desarrollando un catálogo completo de los elementos funcionales de los genomas humano y murino: densos conjuntos de genes codificadores de proteínas, genes no codificadores y elementos reguladores que instruyen a las células sobre cómo y cuándo transcribir secuencias de ADN en ARN. Miles de investigadores en todo el mundo se han valido de los datos del Encode para estudiar la biología del cáncer, las enfermedades cardiovasculares y la genética humana, entre otros aspectos. Prueba de ello son los más de 2.000 artículos derivados de los datos del Encode disponibles libremente para toda la comunidad científica, muchos de ellos relacionados con enfermedades.
"Este es el primer análisis genómico funcional a gran escala de proteínas de unión al ARN con múltiples técnicas diferentes", dice Christopher Burge, profesor de biología del Instituto Tecnológico de Massachusetts. "Esperamos llevar la función del ARN más plenamente al mundo genómico". Burge es uno de los autores más veteranos del estudio, junto con Xiang-Dong Fu y Gene Yeo, de la Universidad de California en San Diego, Eric Lecuyer de la Universidad de Montreal, y Brenton Graveley, de la Universidad de Connecticut.
Con la finalización de esta fase, el proyecto Encode ha añadido millones de "interruptores" de ADN de los genomas humanos y de ratón que parecen regular cuándo y dónde se encienden los genes, y un nuevo registro que asigna una parte de esos interruptores a categorías biológicas útiles. El proyecto también ofrece nuevas herramientas de visualización para ayudar en el uso de grandes conjuntos de datos del Encode.
Gran parte del proyecto se ha basado hasta ahora en la detección de secuencias reglamentarias de ADN utilizando una técnica llamada ChIP-seq, que identifica sitios de ADN, como factores de transcripción, que determinan las funciones de esas secuencias. Sin embargo, Burge señala que esta técnica no detecta elementos genómicos que deben copiarse en el ARN antes de involucrarse en la regulación genética.
En su lugar, se han basado en una técnica conocida como eCLIP, que utiliza luz ultravioleta para cruzar moléculas de ARN con proteínas de unión al ARN (RBP) dentro de las células. Luego aíslan los RBP específicos utilizando anticuerpos y secuencian los ARN a los que estaban vinculados.
Los RMP tienen muchas funciones diferentes: algunos son factores de empalme, que ayudan a cortar secciones de ARN mensajero de codificación de proteínas, mientras que otros detienen la transcripción, mejoran la traducción de proteínas, descomponen el ARN después de la traducción o guían el ARN a una ubicación específica en la célula. Determinar las secuencias de ARN que están enlazadas a los PBP puede ayudar a revelar información sobre la función de esas moléculas de ARN.
La combinación de los datos extraídos con estas técnicas les ha permitido producir un atlas de mapas que describen cómo la actividad de cada RBP depende de su ubicación de enlace. "Por qué se activan en un lugar y se reprimen cuando se unen a otro lugar es un rompecabezas", dice Burge. "Pero tener este conjunto de mapas ayudará a los investigadores a averiguar qué características de proteínas están asociadas con cada patrón de actividad".
Interruptores reguladores
Para evaluar las funciones potenciales de las diferentes regiones del ADN, los investigadores del consorcio estudiaron también los procesos bioquímicos que normalmente se asocian con los interruptores que regulan los genes. Este enfoque bioquímico es una manera eficiente de explorar todo el genoma de forma rápida e integral y ayuda a localizar regiones en el ADN que son "posibles elementos funcionales”.
Los candidatos pueden ser analizados en nuevos experimentos para identificar y caracterizar sus funciones en la regulación genética. "Un desafío clave en el Encode es que diferentes genes y regiones funcionales están activos en diferentes tipos de células", comenta Elise Feingold, de la División de Ciencias del Genoma del NHGRI. "Esto significa que necesitamos analizar un gran número de muestras biológicas para diseñar un catálogo de elementos funcionales en el genoma".
El cuerpo humano se compone de billones de células, con miles de tipos de células. Mientras que todas estas células comparten un conjunto común de instrucciones de ADN, los diversos tipos de células llevan a cabo funciones distintas mediante el uso de la información codificada en el ADN. Las regiones de ADN que actúan como interruptores para activar o desactivar los genes, o ajustar los niveles exactos de actividad génica, ayudan a impulsar la formación de tipos celulares distintos y rigen su funcionamiento en la salud y la enfermedad.
"Los datos generados en Encode 3 aumentarán drásticamente nuestra comprensión del genoma humano", vaticina Brenton Graveley, director del Departamento de Genética y Ciencias del Genoma de Connecticut. "El proyecto ha añadido una enorme resolución y claridad para los tipos de datos anteriores, como las proteínas de unión al ADN y las marcas de cromatina, y nuevos tipos de datos, como las interacciones del ADN de largo alcance y las interacciones entre proteínas y ARN”.
'Nature' y otras grandes revistas científicas publican hoy los resultados de una nueva fase del 'Encode', un catálogo completo de los elementos funcionales del genoma. Off José R. Zárate Investigación Offvia Noticias de diariomedico.... https://ift.tt/3fecq1M
No hay comentarios:
Publicar un comentario