Todavía no se ha completado la secuenciación del genoma humano completo

Por Francisco R. Villatoro, el 17 diciembre, 2009. Categoría(s): Bioquímica • Ciencia • Medicina • Noticias • Prensa rosa • Science ✎ 2

En el año 2000 se anunció la secuenciación del borrador completo del genoma humano. En 2003 se dió por finalizada la secuenciación, publicada en 2004. En 2006 se volvió a anunciar una versión más completa. Sin embargo, en marzo de 2009 todavía no se había logrado secuenciar el genoma humano completo. Se estima que hay unos 300 huecos sin conocer que totalizan entre 300 y 700 millones de nucleótidos (bases). «Es realmente frustante que un pequeño número de incertidumbres en el genoma lleven a un gran número de problemas que impiden obtener un genoma 100% fiable,» dice Richard Gibbs, director del Human Genome Sequencing Center at Baylor College of Medicine, Houston, Texas. Por ejemplo, los 4 millones de bases en el cromosoma 6 que codifican el complejo de histocompatibilidad mayor (MHC) son una de las regiones más variables entre humanos de gran importancia para el estudio de enfermedades inmunitarias. Sólo en europeos se han encontrado más de 37.000 diferencias de un sólo nucleótido (una sola letra en el ADN) y alrededor de 7.000 variaciones estructurales. El genoma humano de referencia tiene que tener identificadas todas las variaciones típicas que aparecen en el genoma de un humano sano con objeto de facilitar la identificación de las variaciones asociadas a enfermedades de origen genético. La odisea de los investigadores que están tratando de finalizar al 100% el proyecto genoma humano nos la cuenta Elie Dolgin, «Human genomics: The genome finishers,» News Feature, Nature 462: 843-845, 17 December 2009.

Realmente sorprendente. Aunque quizás no tanto. Todos sabemos que cuanto más se sabe de algo, más incógnitas aparecen. Saber el 95% de algo cuesta tanto como llegar a conocer el 4% que falta hasta conocer el 99%, o el 0,9% que falta hasta alcanzar el 99,9%, y así sucesivamente. Saberlo todo de algo, normalmente, raya lo imposible.



2 Comentarios

  1. Dices que «…se han encontrado más de 37.000 diferencias de un sólo nucleótido (una sola letra en el ADN)…». Ahora bien, si en el DNA son solo posibles 4 nucelotidos (A, T, G, C), de donde salen las otras 36996 restantes? No sera que hay 37000 tipos de MHC solo en Europa?

    1. El código genético humano tienes unas 2.850.000.0000 de bases o nucleóticos, cada una puede ser A, T, G, o C. Se estima que en 37.000 lugares hay un nucleótido que no se sabe qué letra tiene (si es A, T, G, o C, a veces sólo se ignora es A o G, pero se sabe seguro que no es T o C) ya que esta letra depende del individuo. Hay muy pocos individuos cuyo genoma está secuenciado completamente y es difícil saber qué letra corresponde a la versión del genoma que debemos llamar Genoma de Referencia.

      Ello no significa que haya proteínas diversas en diversos individuos. El código genético permite cierta redundancia, por ejemplo, los trios UUA, UUG, CUU, CUC, CUA, y CUG codifican el mismo aminoácido, la Leucina. Hay 64 combinaciones posibles (4^3) y sólo 20 aminoácidos. Esta redundancia permite proteger al genoma de muchas mutaciones y facilita la transcripción de genes en proteínas. Una mutación en un solo nucleótido en un gen del MHC no significa que haya una variante del MHC, dicho gen puede codificar exactamente la misma proteína. El problema es saber cuál es la variante más común de dicha letra, la que debe ser la referencia.

      Cuando haya miles de genomas humanos completos secuenciados se supone que este tipo de ambiguedades se resolverán mediante estudios estadísticos.

Deja un comentario