Hay distintas formas de viajar al pasado.
Una es la macro, con la mirada hacia afuera, observando el comportamiento de las enormes galaxias y cómo el universo que nos rodea ha variado en el tiempo. La otra es la micro, mirando hacia dentro, hacia los diminutos genes, y comparando también su variación entre especies. Tanto una como otra aproximación se enfrentan a retos tecnológicos.
Para lo más macro, los científicos han desarrollado el Telescopio Espacial Hubble, que orbita alrededor de la tierra y evita la distorsión provocada por la atmósfera terrestre.
Para lo micro, hace años que se usan programas informáticos que comparan secuencias de ADN o de proteínas. Esta técnica, llamada alineamiento múltiple de secuencias (MSA), busca similitudes y diferencias entre las secuencias biológicas de distintas especies para descifrar cuánto hace que dos especies divergieron y predecir cómo cambios específicos en un gen o proteína pueden afectar a su función. Nos ha permitido avanzar mucho en el conocimiento de nuestra historia evolutiva, y de nuestra relación con otras especies, pero tiene sus limitaciones a la hora de comparar grandes números de secuencias; el límite ha sido durante mucho tiempo 100.000 secuencias.
El alineamiento múltiple de secuencias (MSA) permitía hasta ahora comparar hasta 100.000 secuencias de ADN de diferentes especies. Busca similitudes y diferencias entre ellas para descifrar cuánto hace que dos especies divergieron y predecir cómo han afectado los cambios.
De 100.000 a 1,4 millones
Ahora, un equipo de investigadores del Centro de Regulación Genómica (CRG), liderados por Cédric Notredame, han desarrollado un algoritmo mucho más eficiente que permite comparar a la vez 1,4 millones de secuencias – 10 veces más de lo que se podía hasta ahora. Cuantas más secuencias puedan compararse a la vez, más atrás en el tiempo podemos ir.
Las nuevas técnicas de secuenciación nos permiten secuenciar más y más genomas; por ejemplo, el proyecto Earth BioGenome pretende secuenciar y catalogar el genoma de toda la diversidad de organismos eucariotas de la tierra – unos 1,5 millones de secuencias. Ahora, este nuevo algoritmo desarrollado en el CRG nos permitirá compararlas entre ellas para descifrar sus relaciones y su historia evolutiva.
«Hay una gran cantidad de ‘materia oscura’ en biología que todavía no hemos identificado, tanto en nuestro genoma como en el de otros organismos que, aunque aparentemente irrelevantes, pueden tener un papel fundamental en la promoción de la salud humana y la de nuestro planeta, como el descubrimiento de CRISPR en las arqueas», concluye Cédric. «Nuestro desarrollo podrá ayudar a analizar los genomas en más detalle, a encontrar las agujas en el pajar de los genomas de la vida.»
Garriga, E., Di Tommaso, P., Magis, C. et al. Large multiple sequence alignments with a root-to-leaf regressive method. Nat Biotechnol 37, 1466–1470 (2019) doi:10.1038/s41587-019-0333-6