¿Cómo nos ayuda la Genómica comparada a comprender la evolución?

Más vale tarde que nunca: el exdirector de los NIH, Francis Collins, admite los errores de COVID
13/01/2024
CRISPR-Cas9, la revolución en el tratamiento de enfermedades genéticas
02/02/2024

Por Nicolás Jouve. Catedrático emérito de Genética de la UAH y exmiembro del Comité de Bioética de España. Publicado en el Observatorio de Bioética de la UCV el 11 de enero de 2024.

Se puede pensar, con carácter general, que un gen no es una isla en el conjunto del genoma y que la evolución da mayor o menor oportunidad a cada novedad génica para mantenerse o eliminarse en función del resto del genoma preexistente. Esta conclusión general no modifica en nada la teoría tradicional de la evolución que, en todo caso, se enriquece al poder explicar mejor las consecuencias de los fenómenos de modificación que por transferencia horizontal u otros mecanismos parasexuales que ocurren en los procariotas.

La Biología ha desvelado que todos los seres vivos descienden de un sencillo organismo, el “cenancestro”, algo parecido a un procariota primitivo que, una vez formado, condujo a su diversificación por la acumulación lenta y progresiva de modificaciones en su incipiente genoma. Tras su constitución se iniciaría la evolución a base de cambios en el genoma primitivo, su diversificación y selección en los diversos ambientes que ofrecía nuestro planeta desde hace más de 3.500 millones de años. Desde Darwin (1809-1882) sabemos que la diversidad es la fuente de la que se nutre la evolución. El genetista americano de origen ucraniano Theodosius Dobzhansky (1900-1975) sentenció que “nada en Biología tiene sentido si no es a la luz de la evolución” [1], a lo que su más destacado discípulo, el español Francisco José Ayala (1934-2023), añadió que “todo en la evolución tiene sentido a la luz de la Genética” [2]. Tal vez más de veinte años después de la culminación del proyecto genoma humano y de muchas otras especies estemos en condiciones de decir que la evolución encierra sus secretos en la comparación de los genomas.

El motor principal de la evolución son las mutaciones que en sentido amplio generan la variación genética y que se produce por diversos mecanismos en el genoma de los seres vivos. El mecanismo más básico son las mutaciones génicas consistentes en cambios, pérdidas o ganancias de bases nucleotídicas en el ADN de los genes, u otras modificaciones más amplias que afectan a los cromosomas., y que se transmiten de forma vertical de padres a hijos. En los organismos superiores, estas mutaciones se recombinan y propagan a través de la reproducción sexual y afloran en las siguientes generaciones, pudiendo revelarse o no, y seleccionarse dependiendo de sus efectos fenotípicos y capacidad reproductiva en el ambiente en el que se desarrollan sus portadores. En los seres inferiores, como las bacterias y demás procariotas en los que no existe la reproducción sexual, a las mutaciones se une una variación genética debida a “transferencia horizontal”. Esta consiste en una serie de mecanismos parasexuales mediante los cuales al genoma de un organismo se incorpora ADN procedente de otros organismos por diversos medios: “plásmidos” (anillos de ADN que se trasfieren de unas bacterias a otras a través de unos puentes citoplásmicos), virus “bacteriófagos” (que infectan a las bacterias y transducen fragmentos de unas a otras), o “transformación” (captación de regiones de ADN de diversas procedencias del medio en que viven).

La transferencia horizontal es la principal fuente de variación en las bacterias y demás procariotas de cara a la evolución. A lo largo de las generaciones se van añadiendo o eliminando regiones de ADN al genoma básico inicial, nuevos genes procedentes de otros organismos, cuyos efectos fenotípicos son sometidos al filtro de la selección natural, como ocurre con la variación genética procedente de la recombinación en los seres con reproducción sexual. De los genes, los que contribuyen a una mejor adaptación al ambiente se seleccionaran a favor, los que no, permanecerán a la deriva o se eliminaran dependiendo de factores estocásticos y de que sus efectos sean neutros o perjudiciales para sus portadores. El ejemplo clásico, igualmente valido para bacterias u organismos superiores, es la incorporación de genes de resistencia a agentes adversos, como por ejemplo un gen que confiera resistencia a un antibiótico en una bacteria o un gen de resistencia a una micosis o una bacteriosis en una planta o un animal superior. El organismo que incorpora la novedad genética en su genoma generará descendientes capaces de superar el ambiente en el caso de que el agente limitante de su supervivencia este presente, es decir, se producirá una selección a su favor. Sin embargo, en presencia del agente perjudicial no sobrevivirían los organismos que no fuesen portadores del gen de resistencia. De este modo la evolución debe entenderse no tanto como un fenómeno de azar sino más bien de oportunismo, siendo la selección el factor determinante del éxito de cada variante genética.

De este modo el genoma se convierte en un indicador sensible de los eventos evolutivos. De entre las alternativas genéticas que afectan a la eficacia biológica las favorables quedarán fijadas en el genoma de sus portadores y las menos favorables desaparecerán. No obstante, la evolución es lenta, porque lenta y limitada es la aparición de las mutaciones y porque estas no son creadas para solucionar los problemas que plantea el ambiente, sino que son preadaptativas y en su inmensa mayoría, desfavorables.

Tras señalar estas bases necesarias para entender la evolución en términos genéticos, podemos pasar a analizar la aportación de la “genómica comparada”, una rama de la genómica que estudia las secuencias de diferentes organismos de forma comparativa, con el fin de inferir sus relaciones filogenéticas.

La evolución en el pangenoma de un procariota

Recientemente se ha publicado en los Proceedings of the National Academy of Sciences de los EE.UU. [3] un trabajo sobre la evolución del genoma de la bacteria Escherichia coli, que en su versión genómica original, completada en 1997, cuenta con una molécula de ADN circular de 4.639.000 pb,  lo que supone la información de unos 4.300 genes.  Además del genoma principal, puede tener uno o más plásmidos, unos anillos pequeños de entre 3 y 12 kb de ADN que se replican independientemente del genoma principal. El tamaño de los plásmidos puede llegar a crecer considerablemente debido a su estructura modular a base de secuencias que se pueden ir integrando y que juegan un papel importante en la transferencia horizontal.

Como consecuencia, el genoma de las bacterias cuenta con una gran diversidad interespecífica, de modo que diferentes cepas de la misma especie muestran a menudo una variación significativa en el contenido de genes. En el mantenimiento de esta variación participan tanto fenómenos deterministas, como la selección natural, como estocásticos, como la deriva genética, consistente en una fluctuación aleatoria de la presencia de las variantes genéticas en el transcurso de las generaciones.

El análisis que han realizado los autores del trabajo señalado consiste en comparar los genomas de cerca de 2.300 cepas de E. coli, cuya secuencia completa se mantiene en la gran base de datos de genomas del Centro Nacional de Información Biotecnológica (NCBI) [4]. Los genes presentes en todos los genomas de la colección de cepas consultada constituyen el “genoma básico”. A este genoma se añaden en cada cepa otros genes, considerados como genes accesorios. La unión de estos dos conjuntos conforma lo que se ha dado en llamar el “pangenoma”. Lo que los autores tratan de analizar son las relaciones de coevolución entre familias de genes para desvelar en qué medida han influido fenómenos deterministas, es decir beneficiosos, o estocásticos, es decir aleatorios, en el pangenoma de E. coli.

Para ello, han comparado los pangenomas de las diferentes cepas con el fin de investigar si la presencia o ausencia de genes específicos (antecedentes genéticos) puede influir en la presencia o ausencia de otros genes. Se supone que el contenido de cada genoma de E. coli contemporáneo es el resultado de su historia evolutiva, en la que han intervenido tanto la transmisión genética vertical como la horizontal y ha surgido a través de una combinación de efectos de aptitud internos (intragenómicos) y externos (ecológicos), además de la posible incorporación estocástica y no adaptativa (deriva genética). Es un tipo de análisis muy interesante y solo posible de momento en especies como E. coli gracias a la gran colección de genomas disponibles.

Antes de seguir, conviene señalar que el análisis realizado, aunque se centra en una especie bacteriana permite abordar cuestiones relacionadas con la evolución en términos más generales sobre la historia evolutiva de las especies en un nivel no explorado hasta ahora, como es el del genoma, que se sitúa en la cúspide de la jerarquía de la organización de las células en palabras del Nobel británico Christian De Duve (1917-2013) [5].

Los autores se fijan en la afirmación del evolucionista Stephen J. Gould, que en su libro, Wonderful Life: The Burgess Shale and the History of Nature [6]  presentó un experimento en el que la “cinta de la evolución” podría reproducirse desde cualquier punto de la historia. Sugirió que, dado que los caminos evolutivos dependen de eventos impredecibles, si pudiéramos reproducir la historia, no obtendríamos el mismo resultado cada vez. En contra de esta suposición, muchos estudios recientes han sugerido que esta visión es demasiado rígida.

En el estudio desarrollado en E. coli, se analiza la ganancia o pérdida de genes en los pangenomas sobre la base de la presencia o ausencia de otros genes utilizando una nomenclatura de carácter ecológico. De este modo clasifican las relaciones entre dos genes determinados en tres categorías para valorar si su vínculo es estadísticamente significativo: “mutualista”, es decir, de aparente beneficio mutuo; “comensalista”, es decir, un gen beneficia la presencia de un segundo, pero no a la inversa; o “competitivo”, es decir, mutuamente excluyentes en el mismo genoma. Se estudiaron las asociaciones de genes mediante un modelo de presencia o ausencia utilizando un programa de predicción estadística de análisis automático conocido como Random Forest. El estudio incluyó la valoración de la fortaleza del impacto de la presencia o ausencia de cada gen analizado con relación a todos los demás. Sin entrar en más detalles, el estudio realizado permite valorar muy positivamente las posibilidades que ofrece la bioinformática que se ha venido desarrollando a la par de la acumulación de datos de secuencias genómicas en los últimos años.

Como conclusión se observó que en el conjunto de 33.138 relaciones intergénicas analizadas, en una gran mayoría, 20.915, se producen relaciones de mutualismo, donde la presencia conjunta de un par de genes en los genomas es significativamente mayor de lo esperado; 1.073 son de comensalismo, mediante la cual un gen, normalmente el menos abundante del par, generalmente depende del otro, mientras que la dependencia inversa es mucho más débil o inexistente; y 288 casos son de genes competitivos, que se evitan entre sí.

Evidentemente, lo que todo esto demuestra es la gran interacción funcional del conjunto del genoma. Es decir, la importancia del conjunto de genes del genoma frente a la aportación particular de cada gen. Se puede pensar, con carácter general que un gen no es una isla en el conjunto del genoma y que la evolución da mayor o menor oportunidad a cada novedad génica para mantenerse o eliminarse en función del resto del genoma preexistente. Esta conclusión general no modifica en nada la teoría tradicional de la evolución que, en todo caso, se enriquece al poder explicar mejor las consecuencias de los fenómenos de modificación que por transferencia horizontal u otros mecanismos parasexuales que ocurren en los procariotas. Algo, que podría extenderse a las especies con reproducción sexual, aunque en este caso habrá que seguir investigando.

El trabajo en sí tiene otras implicaciones de carácter básico. Permite categorizar el impacto de diferentes genes por su mayor presencia en los distintos pangenomas analizados. Se demuestra que los pares de genes que muestran una relación de mutualismo es independiente del lugar (locus) que ocupan en el genoma. Se deducen explicaciones para los casos de comensalismo o competencia en función del medio ambiente en que se desarrollan las cepas. Se intuyen razones posibles para explicar que los genes predigan la presencia o ausencia de otros genes, incluido el funcionamiento en una vía o proceso común, la redundancia y la ventaja evolutiva compartida en un nuevo entorno.

Finalmente se demuestra la rigidez de la hipótesis de Gould. Los resultados sugieren que es probable que rebobinar la cinta hasta el inicio de la evolución de E. coli daría como resultado cientos o miles de eventos predecibles por cada reproducción de la cinta de la evolución.

Posibles aplicaciones

En esta investigación se evidencia que, aun cuando la evolución es aleatoria en el origen de la variación, se acentúa el papel de la selección en la implantación de las variantes adquiridas. Es decir, se impone el modelo determinista para la admisión de las variantes genéticas que se incorporan al genoma básico. Mayoritariamente la presencia de unos genes apoya la de otros, lo que abre ciertas expectativas de aplicación biotecnológica para, por ejemplo, incorporar genes de resistencia a antibióticos en las cepas bacterianas u otros de interés aplicado sin riesgo de su eliminación. También resulta de gran interés la expectativa en Biología sintética de este tipo de conocimientos para la síntesis de genomas artificiales, como por ejemplo para crear cepas transgénicas para la síntesis de nuevos fármacos, proteínas, vacunas u otros medicamentos.

Nicolás Jouve de la Barreda
Nicolás Jouve de la Barreda
Catedrático Emérito de Genética de la Universidad de Alcalá. Presidente de CiViCa.