Francis en #rosavientos: El Fracaso escolar no está en los genes

Dibujo20160515 gwas snp dna neuroendoimmune wordpress com

Ya está disponible el audio del podcast de Eureka, mi sección en La Rosa de los Vientos de  Onda Cero. Como siempre, una transcripción, unos enlaces y algunas imágenes.

Un análisis del genoma de unas 300.000 personas descubre 74 variantes genéticas relacionadas con el logro educativo: el número de años de escolarización completados. A pesar de que podría parecer que el rendimiento educativo viene influido por los genes, resulta que las variantes genéticas solo dan cuenta de una pequeña fracción de las diferencias entre individuos en educación. El entorno y el origen socioeconómico influyen muchísimo más.

El artículo es Aysu Okbay, Jonathan P. Beauchamp, …, Daniel J. Benjamin, “Genome-wide association study identifies 74 loci associated with educational attainment,”Nature (11 May 2016), doi: 10.1038/nature17671; también recomiendo Cornelius A. Rietveld, Sarah E. Medland, …, Philipp D. Koellinger, “GWAS of 126,559 Individuals Identifies Genetic Variants Associated with Educational Attainment,” Science 340: 1467-1471 (21 Jun 2013), doi: 10.1126/science.1235488.

Más información divulgativa en Javier Sampedro, “¿Fracaso escolar? No culpen a los genes”, Ciencia, El País, 11 May 2016; Judith de Jorge, “No culpe a los genes de las malas notas”, Ciencia, ABC, 12 May 2016.

Dibujo2016015 Manhattan plot for EduYears associations nature17671-f1

Mucha gente piensa que los genes tienen un papel importante en el fracaso escolar. Sin embargo, los profesores suelen afirmar que el entorno y el origen socioeconómico son más relevantes. ¿La ciencia le da la razón a los profesores? Se han realizado un gran número de estudios sobre el papel de los genes en el rendimiento educativo. Para medirlo lo más habitual es usar el número de años de escolarización completados. Uno bastante famoso se publicó en la revista Science en el año 2013; estudió más de 100.000 personas pero solo encontró tres variantes genéticas relacionadas con el éxito educativo, pero solo permitían explicar el 2% de la variación observada. Esta semana se ha publicado en la prestigiosa revista Nature el artículo más completo hasta ahora sobre este tema. Daniel Benjamin, de la Universidad de Southern California en Los Ángeles, ha coordinado a 253 científicos que han estudiado casi 300.000 personas (en concreto, 293.723) de 15 países, aunque todos con ascendencia europea. La edad de los voluntarios fue superior a 30 años y la media de años de escolarización fue de 14,3 años. Este nuevo estudio ha descubierto 74 variantes genéticas que afectan al logro educativo o, lo que es lo mismo, al fracaso escolar. Pero estas variantes genéticas sólo dan cuenta de una pequeña parte, del orden del 3,2%, de las diferencias entre individuos en educación. Una persona que lleve dos copias de la variante genética que tiene el efecto más fuerte conocido lograría completar nueve semanas más de escolarización durante toda su vida que una persona sin ninguna de dichas copias. 

Dibujo20150515 Genetic correlations between EduYears and other traits nature17671-f2

Se ha estudiado variantes genéticas de 300.000 personas, pero secuenciar el genoma completo de cada persona tiene un coste muy alto. ¿Exactamente cómo se ha realizado este estudio genético? En genética, para identificar la relación entre los genes y algún rasgo observable, se usan los estudios de asociación de genoma completo (en inglés, GWAS, por Genome-Wide Association Study). En estos estudios se identifican ciertas marcas génicas llamadas polimorfismos de un solo nucleótido (SNP, siglas en inglés de Single Nucleotide Polymorphism, pronunciado snip). Se trata cambios en la secuencia de ADN que afectan a una sola letra, una sola base, sea adenina (A), timina (T), citosina (C) o guanina (G). El lugar donde se encuentra un snip se llama locus, o en plural loci; algunos loci están dentro de la secuencia de un gen, pero muchos otros están en regiones intergénicas. Se han identificado unos 9,3 millones de snips en sendos loci gracias al Proyecto 1000 Genomas. Los estudios de asociación de genoma completo comparan los datos genéticos obtenidos de miles o cientos de miles de personas con diferentes variantes de un rasgo y se busca desvelar qué genes están ligados a dichos caracteres. Por ejemplo, si ciertas variaciones genéticas son más frecuentes en personas con cierta enfermedad, se dice que estas variaciones están “asociadas” con dicha enfermedad. Estas variaciones son consideradas como señales de la región del genoma humano donde podría estar el factor causante de la enfermedad. La gran ventaja de los estudios de asociación de genoma completo es que no requieren secuenciar el genoma completo de los voluntarios. El genoma humano completo está repartido en 23 pares de cromosomas y contiene unos 3200 millones de pares de bases de ADN. Pero en estos estudios basta estudiar 9,3 millones de loci para cada individuo mediante un análisis estadístico usando herramientas bioinformáticas, aunque solo se han encontrado 74 loci con una asociación suficientemente significativa.

Dibujo20150515 Overview of biological annotation nature17671-f3

Se han encontrado 74 marcadores genéticos en sendos genes relacionados con el éxito educativo. ¿Se sabe cuál es la función que tienen estos 74 genes? Las bases de datos genómicas permiten descubrir los procesos biológicos implicados en cada snip, o variante de una sola letra en el ADN. Los 74 snips descubiertas por este estudio publicado en la revista Nature se encuentran en ciertas regiones del genoma que regulan la expresión de genes relacionados con el desarrollo del tejido nervioso del feto que da lugar al cerebro. Tanto el desarrollo de las neuronas durante el periodo prenatal como los procesos básicos de la construcción del cerebro. En concreto, están relacionados con la proliferación de las células madre precursoras de las neuronas, la migración de las neuronas recién formadas a las diferentes capas del córtex cerebral (que tiene seis capas), la proyección de los axones a sus dianas en otras neuronas, la forma en que brotan las dendritas y sus espinas en cada neurona, y la señalización neuronal y la plasticidad de las sinapsis, las conexiones entre neuronas, durante toda la vida. La identificación de estas variantes genéticas asociadas al desarrollo del cerebro y su funcionamiento sugiere que la correlación causa-efecto con el éxito educativo es relevante. Sin embargo, al cuantificar la capacidad conjunta de los 74 snips a la hora de predecir el rendimiento educativo se obtiene un valor muy bajo, de sólo el 3,2%. Por tanto, los 74 genes descubiertos no son los determinantes principales del rendimiento educativo.

Dibujo2015015 Gene-level biological annotation nature17671-sf9

Los genes descubiertos en el nuevo estudio solo explican parte del éxito educativo de los jóvenes. Sin embargo, los factores sociales y culturales influyen más que los genes. ¿Cómo se miden estas influencias? Para saber cómo influyen las variaciones genéticas en el rendimiento educativa se usa una herramienta matemática llamada análisis factorial. Esta herramienta permite cuantificar la significación estadística de las correlaciones entre variables, por ejemplo, entre las posibles causas y sus posibles efectos. El estudio de Daniel Benjamin, de la Universidad de Southern California en Los Ángeles, y sus colegas ha buscado correlaciones estadísticas entre las variaciones genéticas estudiadas y el número de años de escolarización completados. En esta nueva investigación no se han estudiado otros factores que tienen un impacto mucho mayor en los logros individuales, como la salud, la actitud de los padres y la calidad de la enseñanza. Sin embargo, a la hora de interpretar sus resultados, dado que la genética parece influir sólo un 3,2% en el éxito educativo, los investigadores han destacado el papel de la influencia social. La asociación genética con el nivel de estudios queda eclipsado por otros factores, como el nivel socioeconómico y educativo de la familia del niño. Muchos estudios de asociación de genoma completo han obtenido resultados similares en los últimos años. Los efectos genéticos no operan de forma independiente de los factores ambientales. Y muchas veces su efecto se puede calificar de secundario.Dibujo20150515 The distribution of effect sizes of the 74 lead SNPs nature17671-sf2

 

Este tipo de estudios a gran escala cuestan mucho dinero y en este caso no se han encontrado los “genes del éxito educativo”. ¿Para qué aplicaciones prácticas sirven estos estudios genéticos? El rendimiento educativo es un fenómeno muy complejo en el que influyen muchos factores, luego parece razonable que esté más allá de los genes. Hace unos 20 años en los estudios genómicos era habitual en los medios que se hablara de los “genes de algo”, por ejemplo, los genes de la homosexualidad, o los genes de la obesidad. Sin embargo, hoy en día se considera un asunto muy polémico y que puede dar lugar a interpretaciones engañosas. Por ello los genetistas prefieren evitar usar el término de “genes de algo” y prefieren hablar de “predisposición genética”, o de “influencia genética”. Varios estudios han observado cierta correlación entre el nivel educativo y la salud mental durante la senescencia. Por ejemplo, que la educación parece ser un factor protector contra el Alzheimer. Los resultados de este estudio y el futuros trabajos que se basen en ellos nos permitirán comprender mejor cómo interaccionan los genes relacionados con el éxito educativo y con el envejecimiento del cerebro. Sin lugar a dudas, entenderemos mejor cómo mejorar nuestra salud en la tercera edad y qué cosas nos benefician mientras somos jóvenes en función de nuestros genes. Lo apasionante de la genómica hoy en día es que promete grandes avances en un futuro no muy lejano.

 



15 Comentarios

  1. Pero el primer enlace va directo,ok.
    Un estudio importantísimo para erradicar esos terribles lastres, que aun perdura en algunas ideologías.

  2. Aunque suele caer fuera de mi campo, suelo considerar la divulgación de este blog bastante buena y por eso me chirría bastante un error bastante grave cometido en esta entrada. “…dado que la genética parece influir sólo un 3,2% en el éxito educativo…” y las otras veces que se cita esta cifra y similares dan a entender que no se ha comprendido bien este estudio, o los GWAS en general. Cito la primera línea del abstract del estudio citado que usted mismo enlaza:
    “Educational attainment is strongly influenced by social and other environmental factors, but genetic factors are estimated to account for at least 20% of the variation across individuals”

    La referencia dada para esto es… ¡el otro estudio(enlace no de prensa, sino a Nature) que nos das! Y si me diese la gana podría dar cifras cercanas a 62% http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4210287/ (aunque esto es las notas en el examen GCSE y no el “educational attaintment” en general), pero aceptaré el criterio de los autores del estudio que nos ocupa. 20% es aún así confundir la cifra informando que esta en 6 veces menor, y una proporción de la varianza mayor que la explicada por temas que frecuentemente dan debate(como el tamaño de las aulas o las diferencias entre profesores).

    El problema aquí es confundir las variantes comunes analizadas en este estudio(en torno como bien dices a 74 genes) con la influencia de la diversidad genética completa de la población(la heredabilidad). Esta cifra irá aumentando según tengamos estudios con mayor muestra, variantes raras identificadas y mejor conocimiento de cómo el genoma influye en un rasgo tan complejo como el rendimiento académico. Para cosas más simples como la altura, antes de 2009 teníamos menos de un 1% de la varianza explicados por métodos genómicos, en 2010 llegamos al 10-16% y hoy día tenemos prácticamente explicada la totalidad de su alta heredabilidad (>80%). Fallos en la divulgación podrían hacer que cuando este proceso se repita la gente se pregunte qué demonios ha pasado para que de repente los genes cobren una mayor importancia en explicar las diferencias en resultados escolares.

    1. Xaverius, no has entendido bien lo que digo. El 3,2% es el poder predictivo de los genes: “Across our two holdout samples, the mean predictive power of a polygenic score constructed from all measured SNPs is 3.2%” que es el nuevo resultado de este paper. No es cierto, y no lo dice el abstract, que los genes predigan el 20% del rendimiento educativo como tú quieres leer. Lo siento.

      Cometes el error que dice el propio artículo en Nature: “Studies of genetic analyses of behavioural phenotypes have been prone to misinterpretation, such as characterizing identified associated variants as ‘genes for education’. Such characterization is not correct for many reasons: educational attainment is primarily determined by environmental factors, the explanatory power of the individual SNPs is small, the candidate genes may not be causal, and the genetic associations with educational attainment are mediated by multiple intermediate phenotypes. To illustrate this last point, we studied mediation of the association between the all-SNPs polygenic score and EduYears in two of our cohorts. We found that cognitive performance can statistically account for 23–42% of the association and the personality trait ‘openness to experience’ for approximately 7%.”

      1. All MEASURED SNPs, no todos los SNP existentes, ni todas las duplicaciones de genes, ni todas las deleciones, ni cambios en secuencias reguladoras, ni mutaciones de novo, ni otras formas de diversidad genética existente. Ni fenómenos por distintas combinaciones de genes cuyo efecto depende del otras variantes, como la epistasis. Lo que miden es la varianza genética explicada por lo que hacen explícito en el paper, 74 loci que no es toda la diversidad genética existente. Para eso están los estudios de heredabilidad, que comúnmente dan una cifra bastante mayor a 3.2% (desde 20 a 62%, como le he citado).

        ¿O acaso me va a decir en serio que la altura se ha hecho más heredable, de menos de 1% a 60% en menos de una década? (http://www.ncbi.nlm.nih.gov/pubmed/26323059, véase estimaciones de antes de 2009 donde la altura o el IMC solo tenían 1% de su varianza genética explicada) Si interpretamos los hallazgos como usted parece hacerlo, tendríamos que aceptar esa esperpéntica conclusión.

        No existen solo los estudios de genética molecular, sino también lo de genética cuantitativa, que hace tiempo establecieron una heredabilidad mayor para el rendimiento académico que 3.2%. Que los estudios de genética molecular sigan siendo imperfectos para rasgos complejos no anula las décadas de estudios anteriores.

        1. Si me disculpa la insistencia, le doy otro ejemplo, en este artículo sobre influencia genética en el Alzheimer, tal vez el abstract y los métodos que cita es ilustrativo http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0079771. Lo que está haciendo no sería muy distinto a si, hace unas décadas, cuando se conocía el APOE4 y poco más para incrementar al riesgo del Alzheimer, usted dijese que este es solo 6% heredable(o los genes explican solo 6% del riesgo, varianza, etc.) porque solo conocemos APOE. Habría quedado extraño según se descubriesen el resto que aquí citan y el total de la varianza fenotípica actualmente explicada por marcadores genéticos ascendiese a 33%. Por otra parte, con lo que sacan en este estudio comentan ” Novel AD markers that explain large amounts of phenotypic variance are likely to be rare and unidentifiable using genome-wide association studies.” Indicando que hay otros estudios genómicos aparte del GWAS que podrían explicar más varianza en el futuro, como ocurre con el rendimiento académico.

          Todo esto teniendo en cuenta que hace tiempo que tenemos estimaciones de la heredabilidad del Alzheimer con métodos de genética cuantiativa, por ejemplo aquí estimando un 74% http://www.ncbi.nlm.nih.gov/pubmed/9060980 y por tanto ese 33% probablemente se quede corto y quede más que investigar. Con altura pasó lo mismo, y ya no. Con rendimiento académico pasa lo mismo, y veremos cómo evoluciona.

  3. Quizá me equivoco, ya que aún estoy aprendiendo estas cosillas, pero creo que con muestras más grandes se encontrarían probablemente más resultados y la capacidad predictiva de un score poligénico se iría aproximando al 20% de heredabilidad que dicen los propios autores, en la medida que se vayan sumando más y más SNPs, pero para eso hace falta más potencia estadística (más N) o… basarse en otros modelos genéticos para ese rasgo que puedan dar cuenta de la heredabilidad que se le atribuye (y siempre suponiendo que el dato es consistente). En otras palabras, creo que la predicción del 3,2% del score es otra forma de decir que falta un 16,8% de varianza genotípica por descubrir, NO que el rasgo solo se explique en un 3,2% por los genes. Hay más por descubrir.

    Off-topic, respecto al tema de la correlación vs. causalidad. Evidentemente esto es correlacional y correlación no implica…, pero ¿existe algún modo de investigar la genética de un rasgo humano complejo de forma experimental? Estos estudios, pese a ser caros, son muy eficientes y no están sesgados por hipótesis previas que luego dan lugar a problemas de replicabilidad. Con todo, hay que verlos como algo meramente exploratorio. Son buenos generadores de hipótesis. Como bien se explica en el artículo, para ver si los hallazgos genéticos son correlatos espureos vs. si tienen un posible papel causal existen unos criterios con valor heurístico (Bradford-Hill) y el hecho de que estén implicados en el desarrollo del cerebro fetal apunta a relación causal. Su baja capacidad predictiva es algo, creo, provisional, ya que con más muestra, más potencia y mejor capacidad predictiva del score poligénico. A lo mejor individualmente uno de esos genes solo explica un 0,2% de la varianza fenotípica, algo irrisorio, pero es que esto sirve para ver en que vias y células se expresa ese gen, qué hace y de que forma influye en el fenotipo. Hallando esas vias, puedes empezar a considerar el impacto de variables ambientales en esas mismas vias y si hay interacción con el genotipo.

  4. Vaya, mientras escribía ha escrito Xavierius y estoy de acuerdo con lo que dice. También puede haber variantes raras con efectos mucho mayores y esas cosas que no se detectarían por la metodología empleada en este estudio.

    1. Además que precisamente por ser genes enriquecidos en el desarrollo neuronal fetal y similares que esperarías que estén relacionados con el fenotipo en concreto resulta más improbable que se deba a simple estratificación de la población estando la causalidad principalmente en lo hereditario (que no heredable) de los privilegios ambientales. No es suficiente para decir que todo lo que han encontrado es 100% causal, pero lo hace más difícil a los que insinúan que es un artefacto de otras cosas.
      Las variantes raras son mucho más difíciles de encontrar con el diseño de población grande vs. resultados, pero algo de progreso en ese tema hay, especialmente mirando genomas de fenotipos extremos.

  5. Creo que el camino a seguir sería determinar en primer lugar el grado de incidencia de la genética en el desempeño escolar mediante la comparación de gemelos educados en familias distintas y parejas de estudiantes elegidos arbitrariamente.
    Si obtuviéramos, por ejemplo, una incidencia del 70% y el estudio genético arrojara un 12%, cabría afirmar que nos falta un 58% de información relevante que se escapa a nuestras actuales técnicas de análisis genómico. Y eso sí sería útil para conocer el trecho que nos queda por avanzar.

    Saludos.

    1. Pues eso es precisamente lo que hacen los estudios de genetica del comportamiento que mencionaba xaverius y los resultados que arrojan son que hasta un 60% de la varianza se explica por causas geneticas

Deja un comentario

Por Francisco R. Villatoro
Publicado el ⌚ 16 mayo, 2016
Categoría(s): ✓ Biología • Ciencia • Eureka (La Rosa de los Vientos) • Noticias • Science
Etiqueta(s): ,