El proyecto ENCODE dice adiós al ADN «basura»: el 80% del ADN tiene funciones bioquímicas

Por Francisco R. Villatoro, el 6 septiembre, 2012. Categoría(s): Biología • Bioquímica • Ciencia • Noticias • Science ✎ 28

El proyecto de la Enciclopedia del ADN, llamado ENCODE por Encyclopedia of DNA Elements, ha estudiado con sumo detalle el ADN humano, tanto la parte codificante (genoma), como la no codificante (mal llamada hace una década como «ADN basura»). El hallazgo más notable de este estudio es que el 80% de todo el ADN contiene elementos vinculados a funciones bioquímicas (es decir, tiene «actividad bioquímica específica»), desterrando la idea de que gran parte del ADN es simplemente «basura» evolutiva. Un resultado que fue anticipado en 2007 cuando este proyecto publicó su análisis del 1% del ADN y que obliga a redefinir el concepto de gen como unidad mínima heredada. Gran parte del ADN no codificante, que no se expresa en proteínas, tiene funciones de regulación, por lo que pueden estar relacionados con enfermedades y pueden ser dianas terapéuticas.

El ADN humano tiene unos 3.000 millones de bases («letras» A, G, T, o C), pero solo el 1% contiene unos 21.000 genes que codifican unas 90.000 proteínas. En el ADN entre los genes, el proyecto ENCODE ha descubierto unas 70.000 regiones «promotoras» que se ligan a proteínas para controlar la expresión de los genes. También ha descubierto unas 400.000 regiones «potenciadoras» que regulan (potencian o reducen) la expresión de genes, incluso de genes muy distantes entre sí. Además, ha descubierto 2,9 millones de regiones a las que se ligan proteínas (por ejemplo, factores de transcripción) en los 125 tipos de células estudiados, de las que unos dos tercios se han descubierto en un solo tipo celular y no aparecen en ningún otro tipo. De hecho, solo unas 3,700 de estas regiones son compartidas por todas las células.

En el proyecto ENCODE han trabajado unos 442 científicos durante unos 10 años, estudiando mediante 24 tipos de experimentos diferentes un pequeño trozo de ADN en 147 tipos de células humanas diferentes. El resultado se publica hoy en una serie de 30 artículos en diferentes revistas científicas, destacando 6 artículos en Nature. Nos lo cuentan Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad, Eran Segal, «Genomics: ENCODE explained,» Nature 489: 52–55, 06 September 2012, y Ed Yong, «ENCODE: the rough guide to the human genome,» Discover Magazine, 5 Sep. 2012. El artículo técnico en Nature que describe en detalle el proyecto ENCODE es The ENCODE Project Consortium, «An integrated encyclopedia of DNA elements in the human genome,» Nature 489: 57–74, 06 September 2012. También es interesante el artículo de Ewan Birney, «The making of ENCODE: Lessons for big-data projects,» Nature 489: 49–51, 06 September 2012, del que he extraído la siguiente figura. Por cierto, en 2007 ya se publicaron conclusiones similares en Nature cuando se estudió el 1% del ADN, en concreto, en The ENCODE Project Consortium, «Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project,» Nature 447: 799-816, 14 June 2007.

GENCODE es la parte del proyecto ENCODE que está catalogando los trozos de ARN que se transcriben a partir del ADN, que constituyen casi el 75% de todo el ADN. Sus resultados exigen una nueva definición del concepto de gen. El artículo técnico es Sarah Djebali et al., «Landscape of transcription in human cells,» Nature 489: 101–108, 06 September 2012. Los sitios hipersensibles a la ADNasa I (DHSs por DNase I hypersensitive sites) son marcadores en la cromatina para la regulación del ADN, incluyendo potenciadores (enhancers), promotores,  aisladores (insulators), silenciadores, regiones de control (locus control regions) y factores de transcripción. En la región del ADN estudiada se ha duplicado el número de DHSs conocidos. Los artículos técnicos son Robert E. Thurman et al., «The accessible chromatin landscape of the human genome,» Nature 489: 75–82, 06 September 2012, y Shane Neph et al., «An expansive human regulatory lexicon encoded in transcription factor footprints,» Nature 489: 83–90, 06 September 2012. La red que interconecta los factores de transcripción es estudiada en Mark B. Gerstein et al., «Architecture of the human regulatory network derived from ENCODE data,» Nature 489: 91–100, 06 September 2012. La red que conecta los genes y la parte no codificante del ADN que regula su expresión es muy compleja, contradiciendo el dogma de que la regulación de un gen se realiza mediante elementos reguladores próximos en la cadena de ADN. El artículo técnico es Amartya Sanyal et al., «The long-range interaction landscape of gene promoters,» Nature 489: 109–113, 06 September 2012.

Resumiendo mucho, lo que nos muestra el proyecto ENCODE es que el ADN y la regulación bioquímica de la célula es mucho más compleja de lo que nunca pudimos imaginar. Una de las cosas que más me interesan sobre el ADN, el estudio detallado de los aspectos dinámicos de la regulación génica, está más allá de los objetivos del proyecto ENCODE y requiere el desarrollo de nuevas tecnológicas. Serán necesarias muchas décadas para que podamos empezar a entender el funcionamiento complejo de cada célula humana a partir de su ADN y su epigenoma.

PS: Claudio nos recomienda en los comentarios la lectura de Ewan Birney (ENCODE Project), «ENCODE: My own thoughts,» Ewan’s Blog; Bioinformatician at Large, 5 Sept. 2012.

¿Qué significa que el 80% del genoma tiene una función? Que tiene actividad bioquímica específica; un elemento del ADN es «funcional» si cambia alguna propiedad bioquímica de la célula. Solo el 8% del ADN está en contacto con proteínas (como los sitios de unión a los factores de transcripción); incluso, si se incluyen los exones, este porcentaje solo sube al 9%. Por ello hay que tener cuidado a la hora de interpretar la definición de «funcional» asociada al 80% del ADN.

¿Qué significa este 80% desde el punto de vista de la evolución? Todo el ADN que sufrido el efecto de la selección en la parte más reciente de la evolución humana es considerado «funcional,» incluso si aún no sabemos si tiene efecto fenotípico o no. Solo entre el 10% y el 20% se espera que tengan dicho efecto. Dentro de la colaboración ENCODE se han tenido debates muy intensos sobre qué vocabulario utilizar. Al final la decisión de consenso que se ha tomado puede ser discutible pero está bien fundamentada en los artículos.

PS: Vídeo de Nature sobre el proyecto ENCODE.

[youtube=http://www.youtube.com/watch?v=Y3V2thsJ1Wc&hd=1]

También recomiendo la presentación Flash de Nature ENCODE explorer.

PS (7 sep 2012): Recomiendo ver la entrevista en vídeo a Lluís Montoliu, investigador del CNB (Centro Nacional de Biotecnología) «Cinco respuestas sobre el proyecto ENCODE y el «ADN oscuro»,» realizada por Antonio Martínez Ron @aberron y Miguel Fernández Flores para lainformacion.com.

PS (8 sep 2012): Recomiendo encarecidamente, porque me ha encantado, la lectura de la entrada de PaleoFreak, «FAQ: El Proyecto ENCODE y el supuesto fin del ADN basura,» 7 sep. 2012. En especial destaco que «¿Han dicho los científicos del ENCODE que sus hallazgos refutan la existencia del ADN basura? Creo que no, aunque no descarto que lo hayan dicho en entrevistas. Ni siquiera encuentro la palabra junk en los trabajos de libre acceso publicados en Nature.» Lo que es cierto en los seis artículos técnicos de ENCODE publicados en Nature, no así en los artículos sobre ENCODE publicados en dicha revista.



28 Comentarios

    1. Gracias por la interesante entrada y por el comentario. El blog que apunta Claudio dice : ‘Originally I pushed for using an “80% overall” figure and a “20% conservative floor” figure, since the 20% was extrapolated from the sampling’, que tiene un poco más sentido que el 80%.

  1. «80% del ADN contiene elementos vinculados a funciones bioquímicas, desterrando la idea de que gran parte del ADN es simplemente “basura” evolutiva»

    Erróneo.
    En primer lugar, están llamando «función bioquímica» a algo que no se considera «función» en biología. Se trata de una redefinición terminológica sospechosa.
    En segundo lugar, lo que se detectan son determinados tipos de «actividad» bioquímica. Esa actividad puede ser funcional o no. Puede ser incluso «disfuncional». Puede ser dañina para la célula o puede no significar absolutamente nada.
    En tercer lugar, hay pruebas positivas, teóricas y experimentales, de la existencia de enormes cantidades de ADN basura (sin función) en el genoma. ADN que se comporta y evoluciona como cabría esperar si fuera basura. No se espera de estas secuencias que carezcan totalmente de «actividad bioquímica», por tanto no se refuta su existencia.

    1. Pregunta tonta, con ejemplo chorra y vocabulario acientífico total: tengo 20 tijeras en el cajón, pero sólo uso una. ¿Lo que se ha descubierto es que 18 de ellas podrían usarse, aunque no se usen? Ya después lo traduzco yo en mi neurona.
      Lo de las terminologías y definiciones es un dolor de cabeza. Y si me leyese mi profesora de biología celular me suspendía con efecto retroactivo, fijo.
      P.D.: ¡Sois geniales!

      1. Ro, más bien tienes 18 tijeras rotas en el cajón (o tijeras antiguas que ya no funcionan), que no puedes usar salvo que las repares. Quizás puedas usar alguno de los trozos en el futuro como cuchillo o como palanca. Lo que ha descubierto ENCODE es que estos trozos de tijeras a veces los tomas o los tocas cuando buscas las tijeras que funcionan, por ello tienen actividad bioquímica (lo que no significa que puedan funcionar como tijeras).

  2. Bueno, aquí hay otro artículo que ayuda a aclarar las cosas:
    Presentan el nuevo mapa del genoma humano
    http://www.agenciasinc.es/Noticias/Presentan-el-nuevo-mapa-del-genoma-humano
    «Nuestro genoma sólo funciona gracias a los interruptores: millones de lugares que determinan si un gen se enciende o se apaga», explica Ewan Birney del EMBL-EBI, coordinador de análisis del proyecto. «El proyecto Genoma Humano mostró que sólo el 2% de nuestro genoma contiene genes, que son las instrucciones para hacer proteínas. Pero con ENCODE podemos ver que cerca del 80% del genoma está activamente haciendo algo. Hemos encontrado que una gran parte del genoma – de hecho, una cantidad sorprendente – está implicada en controlar cuándo y dónde se producen las proteínas más allá de simplemente fabricarlas”.
    Estos descubrimientos ofrecen el conocimiento que se necesita para mirar más allá de la estructura lineal del genoma y ver cómo toda la red está conectada. Tan importante es saber dónde se están ubicados los genes como qué secuencias los controlan. Debido a la compleja estructura tridimensional de nuestro genoma, estos controles a menudo están lejos del gen que regulan si leemos la secuencia linealmente, aunque si se hace de forma tridimensional veremos que se encuentran envueltos alrededor para contactar con ellos.

  3. Hola, la clave está en la conservación, los elementos/regiones conservados (que son en torno al 10-20%). Como bien apunta @paleofreak, que al 80% del DNA que no se traduce se unan proteínas, no implica que tengan una función (lo que todos entendemos como función). Por probabilidad estas proteínas (factores de transcripción, etc) se pueden unir a muchas secuencias de DNA, o también puede ser que esas secuencias fueron útiles en el pasado (quizá cuando «éramos» otro organismo) pero la selección natural no las eliminó del todo (quizá era muy costoso y total, si no hacen daño y no ocupan mucho (es decir, podemos ser viables con ellas), pues es «más cómodo» dejarlas) y quedaron retazos que aún son capaces de unir alguna proteína (no sabemos con qué afinidad, por cierto). Pero la clave es la conservación, es decir, la actuación de la selección natural sobre estas zonas. Si la conservación es alta, entonces estas zonas sí son funcionales e importantes; si no están conservadas, no es más que ruído de fondo. Cuanquiera puede ir a la página de ENSEMBLE, poner un gen cualquiera, buscarlo en humano y ver su conservación en otras especies. Ahí se ve claramente como, por ejemplo, los exones de los genes están muy conservados (poned una especie próxima como el chimpancé (pan troglodytes)) mientras que los intrones no.
    El titular ha sido sensacionalista para venderlo, lo entiendo, pero hay que aclararlo para no generar confusión.
    Un saludo

  4. «Pero con ENCODE podemos ver que cerca del 80% del genoma está activamente haciendo algo»

    Si acumulas basura en casa, también hace «algo». Huele mal, te tropiezas con ella, e incluso te puedes confundir y comerte algo. La cuestión es ¿está haciendo «algo» útil y necesario para la casa, o sea, para la célula?

    1. no tiene porqué; simplemente «cuesta más» deshacerse de él que dejarlo estar. Quizá dentro de unos cuantos miles de millones de años deje de existir, no lo sé, todo depende de la presión evolutiva que se ejerza sobre él y el coste que suponga eliminarlo. Pero en mi opinión quedará ahí (si no estorba demasiado). Es otro ejemplo más de que no somos «hijos» de un diseñador (un diseñador recortaría perfectamente el genoma dejando sólo lo útil y desechando lo demás); no hay diseñador, no hay diseño, no hay intención, simplemente hay evolución.

      1. Para Bitácora del Beagle: Sólo faltaria que se haga genética mirando a ver qué piensan los creacionistas. Si los científicos del proyecto ENCODE te están diciendo que ese ADN está ahí por algo, pues eso, está por algo. La teoría de la evolución sigue intacta.

        1. Con tres títulos universitarios en biología sinplemente NO PUEDO, NO PUEDO creerme lo de la casualidad evolucionista. Nunca me he pasado la vida dentro de una iglesia, pero me es mucho más fácil creerme lo de una mente prodigiosa y ordenada que el resultado de una ruleta de azar. Por tomar un ejemplo, las reacciones inflamatorias. En un principio creíamos que las bloqueban ólo los corticoides, después entendimos que éstos tenían otras muchas acciones además de bloquear las inflamciones. Luego descubrimos los antiinflamatorios no esteroides. Y después descubrimos otras muchas acciones de ellos. Después los antidesgranulación de mastocitos, después los lukast, después los favorecedores de apçoptosis de los eosinófilos , las antileukinas y así después de cada puerta se abre otra y otra. ¿Y todas son casuales?

        2. mira si es que ENCODE ha desscubierto que gran parte de ese adn «Basura» tiene funcione de interruptor para otros genes pues literalmente ya tiene una función o acaso que amigo y esa analogia de la basura tirada por el suelo y demas pues es algo que no va con el tema ya que mas de el 80% tiene función reguladora encambio la basura que dejas por el suelo pues no cuemple ninguna función excepto la de tropezar como tu bien la dijistes pero este caso no es asi esta adn «basura» tiene la función de regular y lo de el diseñador pues esto muestra bien claro que el diseñador tuvo bien claro los planes y propositos para ese fragmento de ADN alli asi que pues no se puede decir nada

      2. ¿Y si el diseñador no diseñó únicamente nuestra especie, sino unos cuantos miles o millones y creó un sólo diseño de ADN como un chassis para millones de modelos diferentes de coches? ¿Somos tan soberbios como para creer que el diseñador se iba a tomar tantas molestias sólo para nosotros? Si yo fuera el diseñador haría UN SOLO ADN con mucho mucho espacio para poner TODA LA INFORMACIÓN posible y necesaria.

    2. A ver, @paleofreak, después de la frase que has copiado viene esta otra:
      «Hemos encontrado que una gran parte del genoma – de hecho, una cantidad sorprendente – está implicada en controlar cuándo y dónde se producen las proteínas más allá de simplemente fabricarlas”.
      Aquí lo tienes más claro aún, en versión original:
      http://www.nature.com/nature/journal/v489/n7414/full/489052a.html
      «One of the more remarkable findings described in the consortium’s ‘entrée’ paper is that 80% of the genome contains elements linked to biochemical functions, dispatching the widely held view that the human genome is mostly ‘junk DNA’. The authors report that the space between genes is filled with enhancers (regulatory DNA elements), promoters (the sites at which DNA’s transcription into RNA is initiated) and numerous previously overlooked regions that encode RNA transcripts that are not translated into proteins but might have regulatory roles.»
      «The vast majority of the human genome does not code for proteins and, until now, did not seem to contain defined gene-regulatory elements. Why evolution would maintain large amounts of ‘useless’ DNA had remained a mystery, and seemed wasteful. It turns out, however, that there are good reasons to keep this DNA. Results from the ENCODE project show that most of these stretches of DNA harbour regions that bind proteins and RNA molecules, bringing these into positions from which they cooperate with each other to regulate the function and level of expression of protein-coding genes.»

  5. Absoluta soberbia. En una escala mayor, resulta excepcional encontrar en los organismos vivos elementos realmente inútiles. La naturaleza es, en ese sentido, «ultra-eficiente.»
    Mas lo será sobre un elemento central de información como el ADN.
    Y cuanto tiempo tiene la ciencia genética para haber llegado a tan rimbombantes conclusiones? Contemos desde los tiempos de Mendel o desde los tiempos de Susumu Ohno, lo mismo da, no es mucho.
    Pero no, ya decidieron que aquello cuya utilidad no entienden es «basura».
    Calculo que hay mas basura en sus cabezas que en el ADN.

  6. Acerca de esta cuestión, que ya es compleja, no sabemos mucho. El hecho cierto de que haya elementos inútiles en el genoma humano no responde cuál es la función del material genético que no se usa. Un debate similar se planteó a raíz de la teoría de la endosimbiosis serial propuesta por Lynn Margulis, una mujer brillante que en mi opinión es una científica clave del siglo XX. Margulis se apresuró a señalar que la teoría neodarwinista enfatizaba en exceso el material genético del núcleo de la célula. Investigó las mitocondrias, los orgánulos celulares y los cloroplastos y vio que el material genético contenido en esas estructuras tenía relevancia. Una postura tan arriesgada y rompedora con el canon vigente concitó la displicencia de sus colegas, pero posteriores investigaciones comprobaron que el ADN de las mitocondrias y cloroplastos es mucho más parecido al material genético de las bacterias que al del genoma nuclear genético de la célula eucariota. En este punto del relato se producía un choque entre la lentitud con que opera la selección natural y el mecanismo simbiótico de varias bacterias para crear una célula nueva que no se produce por mutación sino por fusión o simbiosis. La selección natural recupera su función a posteriori, una vez que la nueva célula ha sido creada. No obstante, la teoría de Margulis tiene puntos débiles que sus contrincantes no dudan en mostrar. El asunto del material genético parásito da lugar a postular hipótesis arriesgadas y relativiza la función genotípica respecto de de la estrecha relación que existe entre el fenotipo y el ambiente. Si el ambiente entorpece la expresión del fenotipo el material genético que no se usa seguirá, en mi opinión, en el limbo epistemológico.

  7. Exelente abreojos. Habrá que añadir el factor de la temporalidad, ya que solo un tiempo determinado promovera la basura a algo útil. Solo se requiere que en esa escala la basura tendrá función. Nuevamente cerraríamos ciclos. Me alegra que a cada función de cierto(s) locus (loci) del ADN se le haya dado nombre como en la sociedad humana corriente: promotor (propagandista), inhibidor (censura), silenciador (sicario, francotirador, dinero), etc. Lo veo en forma un tanto simplista para propósitos de nemotecnia propia. Sin embargo, sería bueno pensar en identificar y desglozar la basura en (reciclable, perecedera, combustible, etc.). Felicitaciones a todos los involucrados en la interpretación y divulgación científica.

  8. No sería prudente descartar de raíz que el ADN llamado basura pueda tener alguna función reguladora, quizás alguna mínima parte del mismo (o quizás una importante fracción como se presentó) pueda tener alguna función, pero desde mi visión lateral al asunto, creo que si tiene una función para nada trivial si realmente se trata de “sólo basura” y es estar en gran cantidad para que las posibles mutaciones ocurran con mayor probabilidad allí y no en zonas importantes y todavía seamos lo que somos…Sería interesante para mí conocer (pues desconozco) que tan distintos (o no) son los “genes” y el “ADN basura” actuales respecto de nuestros antepasados y con esa información se podría tener una visión más acertada del asunto. De seguro la mayor cantidad de mutaciones a lo largo del tiempo han ocurrido en las “zonas basura” y si como resultado de esas mutaciones hemos ido mejorando evolutivamente entonces podríamos pensar que alguna función tienen…claro, si resultara que en los “genes” el cambio no fue significativo…

  9. Si un segmento de DNA no forma proteinas, es posible que regule o controle genes, pero ¿cómo lo hace sin producir nada, al menos ninguna proteína? ¿mediante RNA?

    1. Mann, hay secuencias de ADN que no hacen nada (son residuo de la evolución); otras que no se expresan, pero son lugares a los que enlazan promotores y factores de transcripción para regular la expresión de los genes, o que ayudan al plegamiento del ADN en el núcleo; y entre las que se transcriben (de ADN a ARN), además de codificar genes, hay muchas que codifican moléculas de ARN con múltiples funciones (ARN de transferencia, ribosómico, de interferencia, ribozimas con actividad catalítica, etc.). Consulta la wikipedia para un repaso rápido: ARN y ADN.

      En este blog te recomiendo leer: «Para qué sirve el ADN basura y por qué las células fabrican ARN a partir de él» LCMF 30 Ago 2008; «El proyecto ENCODE dice adiós al ADN “basura”: el 80% del ADN tiene funciones bioquímicas» LCMF, 06 Sep 2012; «La importancia del proyecto ENCODE en el estudio genético de las enfermedades» LCMF, 07 Sep 2012; «¿Golpe fatal contra ENCODE y la “utilidad” del ADN “basura”?» LCMF, 13 Feb 2013; …

Deja un comentario