Genes ocultos en el ADN ‘basura’: una nueva sorpresa en el mapa de la vida

Hace ya casi 20 años del Proyecto Genoma Humano y, sin embargo, aún no sabemos cuántos genes tenemos. Recientemente, en porciones de ADN de ratón que se consideraban ‘basura’ se ha encontrado un gen esencial en procesos autoinmunes. Los investigadores creen que el hallazgo es extensible a humanos y proponen cientos de candidatos adicionales. Se abre toda una vía de estudios y repercusiones.

Este artículo es una colaboración de Jesús Méndez con la Agencia Sinc, donde fue publicado originalmente.

*

El genoma, como el pasado, es todavía un país extranjero. Aunque hace ya casi dos décadas que se publicó la primera secuencia prácticamente completa de nuestro ADN, los expertos no se ponen de acuerdo aún sobre cuántos genes tenemos con exactitud. Y la cosa acaba de complicarse un poco más: científicos de la universidad de Yale han confirmado en ratones la existencia de al menos un gen con su proteína asociada en lo que tiempo atrás se consideraba mero ADN basura, un lugar fuera del mapa.

Proponen, además, múltiples candidatos adicionales y una nueva forma de rastrear. Lo publicaron a finales del año 2018 en la revista Nature, aunque ha pasado ligera y extrañamente desapercibido.

“3.000 dólares para quien acierte cuántos genes tenemos”. Esa era la propuesta del concurso GeneSweep, lanzada en el año 2000 por el ahora director del Instituto Europeo de Bioinformática, el británico Ewan Birney. Todavía no se había publicado el primer borrador del Proyecto Genoma y participaron más de mil investigadores de todo el mundo: en promedio dijeron que teníamos 40.000, desde alguno que dijo unos 26.000 hasta otro que se fue más allá de los 312.000.

Qué es un gen

Aunque la definición de gen ha ido cambiando, se considera que es un segmento de ADN con la información necesaria para fabricar una proteína (previo paso intermedio por una molécula de ARN). Con esa asunción, ahora mismo se acepta que hay alrededor de 20.000 genes. Sin embargo, según un trabajo reciente firmado por varios investigadores españoles, seguramente haya un mínimo de 2.000 menos.

¿Quién tiene razón?

Es posible que nadie.

Para filtrar de entre todo el ADN las partes candidatas a ser un gen, los científicos asumen al menos dos criterios: que comience por tres letras concretas y que tenga una longitud mínima antes de que aparezca una información de stop (un buen marco de lectura, en la jerga).

“Estos criterios eran muy restrictivos para predecir con precisión los genes codificadores de todo el genoma, una gran empresa que ha sido muy exitosa. Se necesitaban reglas fuertes para evitar cantidades enormes de errores”, comenta Ruahidri Jackson, primer firmante del nuevo trabajo. “Las reglas clásicas eran excelentes —añade—, pero, como con todas las reglas en biología, hay algunas excepciones”.

Desde hace tiempo se sospechaba que podía haber otras regiones del ADN dando lugar a lo que, por salirse de las reglas clásicas, se llamaron ‘productos proteináceos’. Ahora se ha demostrado por primera vez.

Si buena parte de lo que se llamó ‘ADN basura’ estaba en realidad activo y funcionaba regulando la acción de los genes a la manera de un director, resulta que hay casos en que los que no solo marca el ritmo de la película, sino que también la protagoniza. Contra la tendencia a la poda en el número de genes, aparecen ahora nuevos actores y funciones en lugares antes ignorados.

Un estudio a ciegas

En lugar de asumir los criterios tradicionales, el equipo de la universidad de Yale realizó lo que se conoce como una aproximación libre de hipótesis. En la secuencia del trabajo primero infectaron ratones de laboratorio con bacterias del tipo Salmonella y aislaron sus macrófagos, los glóbulos blancos de la sangre. Después hicieron el camino inverso a la investigación de búsqueda convencional.

Simulación de un ribosoma produciendo una proteína.

El pilar central de la biología molecular dice que el ADN se transcribe a ARN y que este se traduce en proteínas dentro de los ribosomas, las verdaderas fábricas de la célula. En este caso, en lugar de estudiar directamente el ADN, se aprovecharon de una nueva técnica que permite aislar todo el ARN que ha llegado hasta estas fábricas y después desanduvieron el camino. Se trataba de observar, más que de predecir. Y eso puede acarrear sorpresas.

Cuando analizaron todo lo que pasaba, los números se agitaron. Hasta el 10 % del ARN tenía su origen en ADN no codificante. Para empezar, nunca debería haber llegado hasta allá. Pero eso no significa que esté dando lugar a proteínas: podría no ser funcional o simplemente degradarse nada más fabricarse.

Para buscar candidatos fiables en los que bucear, aplicaron unos criterios más laxos que los convencionales: fijaron una longitud mínima menor que la tradicional y se quedaron con aquellos que comenzaban con las cuatro combinaciones de letras más probables (en lugar de solo una).

Resultaron más de 200 candidatos y escogieron uno con el nombre (nada sexy) de Aw112010. Aprovechando las posibilidades de CRISPR —la nueva herramienta de edición genética— le hicieron todas las preguntas posibles y las respuestas fueron contundentes: no solo daba lugar a una proteína claramente identificable, sino que esta era un mediador fundamental de la inflamación, clave para que los ratones respondieran a la presencia de bacterias.

Si se impedía que esa proteína se formase, los animales acumulaban colonias de microorganismos que se diseminaban hacia el hígado y el bazo. Y al contrario: si se les provocaba una respuesta inflamatoria, como la que se produce en la enfermedad de Crohn o la colitis ulcerosa, su ausencia funcionaba como un factor protector. Aw112010 parece ser, realmente, un actor principal en una región antes olvidada (…)

*

Seguir leyendo sobre las repercusiones del estudio aquí, en Agencia Sinc.

Publicado por Jesús Méndez

Escritor y periodista científico. MD, PhD

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *