Una enciclopedia masiva cataloga las regiones reguladoras del genoma

Actualizado: 23 de sep de 2020


Expresión alterada: las proteínas que se unen al ARN, las instrucciones de construcción de proteínas de la célula, ayudan a controlar la expresión de los genes. Juan Gaertner / Fototeca de Ciencia



POR CHLOE WILLIAMS

Fuente: Spectrum / 26/08/2020

Fotografía: Fototeca de Ciencia



Los investigadores han creado el catálogo más completo hasta la fecha de regiones de ADN que modifican la expresión de los genes (1,2). La enciclopedia, publicada por primera vez en 2007 y actualizada el mes pasado, está ayudando a los investigadores a descubrir las funciones de los segmentos de ADN entre los genes y su papel en condiciones como el autismo.

Los genes constituyen menos del 2 por ciento del genoma humano. Muchas variantes genéticas relacionadas con el autismo se encuentran fuera de los genes, en secciones "no codificadas" del ADN. Un gran desafío para los científicos ha sido descifrar las funciones de estas regiones no codificantes.

En 2003, los investigadores comenzaron a trabajar en la Enciclopedia de Elementos de ADN (ENCODE), un proyecto que tiene como objetivo interpretar la función del ADN más allá de los genes.

Inicialmente, los científicos peinaron el 1 por ciento del genoma para identificar los tramos de ADN que codifican moléculas como las proteínas, y los llamados "elementos funcionales" que regulan la expresión de los genes. En 2012, el equipo amplió la enciclopedia para incluir todo el genoma, y dos años más tarde, mapearon los elementos funcionales en el genoma del ratón.

El último lanzamiento del proyecto, ENCODE 3, descrito en julio en Nature, incluye datos de casi 6.000 experimentos, más del doble que en la versión anterior. También detalla los elementos funcionales en más de 1.300 muestras de células de ratones y personas, que representan 503 tipos de células y tejidos, unas cuatro veces más que en las versiones anteriores (3). Una futura versión está programada para incluir aún más experimentos y muestras de células, dicen los investigadores.

Los investigadores pueden explorar los datos de todos los experimentos de ENCODE en línea.

Registro de regulación

Para crear la enciclopedia, cientos de investigadores realizaron una serie de experimentos para recoger pistas moleculares sobre la ubicación de los elementos funcionales en el genoma y sus posibles funciones. Para el nuevo lanzamiento, los investigadores estudiaron células tomadas directamente de personas y ratones, que pueden recapitular tejido sano con mayor precisión que las células cultivadas en laboratorio utilizadas para las versiones anteriores de ENCODE.

En una prueba, por ejemplo, los investigadores identificaron secciones de cromatina - el complejo en espiral de ADN y proteínas llamadas histonas, que son accesibles a las enzimas. Se cree que las regiones accesibles a las enzimas y otras proteínas desempeñan un papel en la expresión de los genes.

En otro experimento, hicieron un mapa de los sitios de unión dentro del genoma de 282 "factores de transcripción", proteínas que participan en la modulación de la expresión genética. El equipo también secuenció tramos de ADN cerca de las histonas que tienen marcas químicas que alteran la fuerza con la que el ADN está herido. Un viento más cerrado bloquea el acceso a las proteínas que inician la expresión de los genes.

Los investigadores aprovecharon todas estas pistas moleculares para identificar posibles elementos reguladores, como los promotores, que modifican la expresión de los genes vecinos, y los potenciadores, que modulan la expresión de los genes distantes. El equipo clasificó estos elementos reguladores basándose en sus asociaciones con distintas marcas de histonas o factores de transcripción, y en su proximidad al inicio de una secuencia de genes. El nuevo catálogo documenta 926.535 elementos reguladores probables en personas y 339.815 en ratones.

"En cualquier tejido dado, hay unos pocos cientos de miles que están activos", dice Mark Gerstein, profesor de informática biomédica en la Universidad de Yale y uno de los investigadores principales del proyecto.

El catálogo, al que se puede acceder a través de un servidor web, podría ayudar a los investigadores a comprender mejor las regiones no codificantes del genoma, dice Gerstein. Emparejado con otros conjuntos de datos, podría ayudar a los científicos a identificar las regiones reguladoras que son particularmente activas en el cerebro.

Rango del ARN

En otro estudio, publicado en julio en Genome Biology, los investigadores utilizaron ENCODE para desarrollar una forma de identificar las variantes genéticas con mayor probabilidad de comprometer las proteínas que se unen al ARN, las instrucciones de construcción de proteínas de una célula (4).

Estas "proteínas de unión al ARN" ayudan a estabilizar, cambiar o destruir el ARN, alterando la forma en que los genes se expresan en una célula. Los estudios han vinculado las mutaciones en algunas proteínas de unión al ARN con el autismo.

La última publicación de ENCODE detalla los sitios de unión de 112 de estas proteínas. Utilizando estos datos, los investigadores catalogaron 52,6 millones de letras de código genético que componen estos sitios.

Luego crearon un software que califica las variantes dentro de estas regiones basándose en varias líneas de evidencia, como por ejemplo si la variante se encuentra en una secuencia altamente conservada, sugiriendo que tiene una función importante, o el grado en que la secuencia de la variante altera el sitio de unión de la proteína. Un alto puntaje sugiere que la variante altera la unión de la proteína.

El software también puede programarse para que tenga en cuenta en la puntuación criterios específicos de los tejidos, como por ejemplo si una variante se encuentra dentro de un elemento regulador conocido activo en el cerebro.

Para probar el software, el equipo comparó las puntuaciones de las variantes documentadas en otros dos conjuntos de datos, la Base de Datos de Mutaciones Genéticas Humanas y el Proyecto 1000 Genomas.

Como era de esperar, las variantes con vínculos a condiciones médicas tuvieron puntuaciones significativamente más altas que las que no los tenían, según informaron los investigadores. El programa informático también puso de relieve 720 variantes relacionadas con condiciones médicas que otros métodos de clasificación de variantes no descubrieron.

El programa informático podría ayudar a los investigadores a descubrir variantes relacionadas con proteínas de unión al ARN con funciones importantes que otros métodos no han descubierto, incluidas las relacionadas con el autismo, dicen los investigadores. Está disponible gratuitamente en línea.

REFERENCIAS

1. ENCODE Project Consortium et al. Nature 583, 699-710 (2020) PubMed

2. Hon C. y P. Carninci Nature 583, 685-686 (2020) PubMed.

3. Yue F. et al. Nature 515, 355-364 (2014) PubMed.

4. Zhang J. y otros. Genoma Biol. 21, 151 (2020) PubMed.

TAGS: autismo, bioinformática, cromatina, epigenética, expresión de genes.



Entradas Recientes

Ver todo

Buzón de preferencias

Al suscribirte estás aceptando nuestra política de privacidad

Al rellenar formularios estás aceptando nuestra política de privacidad

  • Instagram
  • White Facebook Icon

© 2023 by TheHours. Proudly created with Wix.com