La epidemiología genómica del coronavirus SARS-CoV-2 en la web NextStrain

Por Francisco R. Villatoro, el 21 abril, 2020. Categoría(s): Biología • Bioquímica • Ciencia • Noticias • Recomendación • Science • Virología ✎ 3

He publicado un vídeo en mi canal de YouTube sobre la web NextStrain.org. Me centro en la información que aparece sobre el coronavirus SARS-CoV-2 y la enfermedad COVID-19 (ncov en dicha web). Pregunté en Twitter si mis seguidores estaban interesados en un vídeo sobre este tema y resultó que había bastante interés. Ayer (20 de abril) por la tarde grabé el vídeo, pero me fui imposible subirlo a YouTube; tras dos intentos fallidos llegué a la conclusión de que era imposible y borré el vídeo. Hoy lo he vuelto a grabar y lo he subido sin problemas, ¡cosas de YouTube en tiempos de COVID-19!

Se trata de una charla informal apoyada por una presentación, con accesos a las páginas web citadas. Mi objetivo es motivar a navegar por la web NextStrain.org, a disfrutar de su contenido y ayudar a algunos profesores que impartan clase de genética a incorporar a sus clases esta herramienta como complemento. Por cierto, si tiene cierto éxito, lo mismo me animo a preparar otros vídeos con un estilo similar sobre otros temas de interés. Como ya sabrás, no soy youtuber, ni lo pretendo; no tengo tiempo libre suficiente como para poder realizar vídeos con calidad semiprofesional. En cualquier caso, mi objetivo es que aprendas algunas cosas y ¡qué disfrutes del vídeo!

La web nexstrain.orgnext strain» significa «nueva cepa») presenta información de epidemiología molecular sobre once epidemias (algunas son pandemias). También llamada epidemiología genómica, su objetivo es el estudio de las epidemias mediante la filogenia molecular de las mutaciones en los genomas de los patógenos. La pandemia COVID-19, producida por el coronavirus SARS-CoV-2 (ncov en el menú porque su primer nombre fue 2019-nCoV), provocada por un virus de ARN monocatenario de sentido positivo ssRNA(+). También las epidemias del virus del Nilo occidental (WNV), del Zika (zika), del dengue (dengue), de las paperas (mumps), del sarampión (measles), del Ébola en la epidemia de 2013 a 2016 (ebola), y del enterovirus D68 (enterovirus). También de la gripe estacional (flu, seasonal) y de la gripe aviar (flu, avian) cuyos genomas están formados por ocho secuencias de ARN, llamadas segmentos. Y, finalmente, de la tuberculosis (provocada por una bacteria Gram+).

Los más de 4500 genomas (ARN) de SARS-CoV-2 que se analizan en la web NextStrain se obtienen de la base de datos de GISAID (que ya contiene más de 10 500). No explico en el vídeo esta web, que también merece una visita.

La página web NextStrain está montada gracias a dos software open source escritos en Python 3.5. Por un lado, Auspice para la visualización gráfica de los tres paneles, el árbol filogenético en diferentes formatos, el mapa con animaciones de la extensión de la epidemia, y la organización del genoma con las mutaciones de los nucleótidos del ARN y de los codones de sus genes que codifican los aminoácidos de sus proteínas.

También recomiendo la página web NextSpain, la versión española de la web NextStrain centrada en los genomas de SARS-2 que se han secuenciado en muestras de enfermos en España; ha sido desarrollada por el Consorcio para la Epidemiología Genómica de Pátogneos, liderado por la Universidad de Valencia y al que pertenecen múltiples instituciones. Todas ellas están secuenciando genomas del nuevo coronavirus en España, que se está incluyendo en GISAID y que se muestran en la web NextStrain. En mi vídeo recomiendo esta web, pero me centro en la versión internacional.

En el vídeo repaso alguna información básica sobre el genoma del SARS-2, apoyándome en la base de datos genómicos de la NCBI y en una infografía publicada en The New York Times. Ambos son muy recomendables. En esta imagen te muestro la organización del genoma (ARN) del coronavirus según la base de datos NCBI (su genoma de referencia tiene el código único NC_045512.2; por supuesto, hay muchos otros (más de mil) que difieren del de referencia por cierto número de mutaciones).

Para la construcción de los árboles filogenéticos se requiere un alineamiento múltiple de todas las secuencias de los coronavirus. La razón es que la posición de los genes difiere debido a la presencia de mutaciones. Aquí se muestran para el gen/proteína ORF3a; la secuencia de aminoácidos es idéntica (solo con mutaciones sinónimas de nucleótidos), pero su posición en el ARN difiere (25390 para MT344961.1, 25393 para MN908947 y 25396 para LC528232).

En los árboles filogenéticos los puntos de diferentes colores indican los diferentes genomas del coronavirus (apuntando con el ratón se abre una ventana que especifica la fecha, lugar y mutaciones principales de cada uno). Hacia atrás las ramas del árbol convergen en ciertos puntos (los ancestros comunes a las secuencias mutadas) que están marcados con una fecha estimada, con un intervalo de confianza (apuntando con el ratón se despliega una ventana con estos datos). Hay información en español que explica cómo interpretar los árboles filogenéticos.

En la web NextStrain se incluyen informes de la situación de la pandemia de COVID-19 en varios idiomas. El último (situation report) es del 17 de abril de 2020 sobre la epidemia en EEUU y no está traducido al español (a día de hoy 21 de abril). El último traducido es el informe del 10 de abril de 2020 (que se tradujo el 12 de abril). Te recomiendo leerlo, porque ofrece información muy instructiva.

La documentación técnica que acompaña a la web NextStrain describe cómo instalar los software Augur y Auspice. También ofrece tutoriales de uso aplicados al Zika y a la tuberculosis. Los informáticos y bioinformáticos que lean esto disfrutarán de dicha información.

En resumen, mi intención es motivarte para que visites la web NextStrain.org y disfrutes con la información que ofrece. Mi vídeo es un poco más largo de lo que esperaba, pero espero que sea útil para promocionar esta web tan interesante. O que al menos sirva para ofrecer alguna información de interés sobre el SARS-CoV-2 y la COVID-19. Lo dicho, ¡qué lo disfrutes!



3 Comentarios

  1. Gracias Francis, muy currado.
    Siendo lego en la materia, yo todavía tengo que seguir viendo más videos del canal https://www.youtube.com/user/ibioseminars
    Aunque la verdad es que siendo de generación de la ESO (rama tecnologica) hecho de menos conocimientos de biología/bioquímica básica del antiguo Bachiller (o de la rama socio-sanitaria).

    Saludos!

  2. Francis
    Hay alguna pagina web o video de youtube o algun material que muestre a nivel de proteinas una explicacion de todo el camino del virus en el cuerpo desde la entrada a las celulas del sistema inmunitario en el pulmon hasta el proceso interno de las celulas porque mueren porque la tormenta de citoquinas y el daño pulmonar

    1. Benjamin, a nivel de proteínas no, pues no se conoce. Una infección como la COVID-19 puede implicar cientos, sino miles de proteínas. Hay vídeos que te muestran algunas proteínas; en español, por ejemplo, muy sencillo https://www.youtube.com/watch?v=0jM5re6e_4c, más biomédico https://www.youtube.com/watch?v=4rjyRBw8294, diferentes efectos https://www.youtube.com/watch?v=EZ9KPpAuCfw, entre muchos otros vídeos. En inglés hay cientos, de nivel técnico muy diferente. Si buscas en YouTube encontrarás fácilmente lo que buscas; por ejemplo, https://www.youtube.com/watch?v=XlnUt9vK3-Q, https://www.youtube.com/watch?v=6DxlkxA82FM, https://www.youtube.com/watch?v=r1i5kDAX48M, entre muchos otros vídeos.

      Por cierto, debes leer a Antonio Martínez Ron, «No es una neumonía más: así lanza el coronavirus su ataque silencioso y sistémico. Cada vez más pruebas señalan el daño vascular como origen del fallo multiorgánico y el resto de manifestaciones inesperadas de la enfermedad. No es solo un virus respiratorio, la inflamación y el daño endotelial lo convierten en un patógeno ‘total’ cuya primera ‘estación’ son los pulmones», Next, Voz Pópuli, 23 abr 2020.

Deja un comentario