Tomàs Marquès-Bonet es el Investigador Principal del Comparative Genomics Lab, del Instituto de Biología Evolutiva (IBE: CSIC-UPF), y desde hace años está participando en un proyecto que está revolucionando el mundo de la genómica y la biodiversidad: el Vertebrate Genomes Project.
Ahora, con la publicación de un artículo en Nature, han puesto la primera de las 70.000 piezas de este puzzle genómico y nosotros, robándole un rato de su descanso, hemos querido saber más.
Primera pregunta obligada: ¿Qué es el Vertebrate Genomes Project?
Hace ya más de 10 años un grupo de personas (entre las cuales me incluyo), viendo la crisis de biodiversidad global y teniendo en cuenta que de muchas especies no teníamos el genoma de referencia, es decir, que no teníamos un genoma completo de suficiente calidad, empezamos un proyecto para secuenciar 10.000 vertebrados, dando prioridad a las especies más amenazadas: el consorcio Genome10K.
Empezamos a trabajar y, aunque 10.000 especies ya era una cifra muy ambiciosa, en 2017 iniciamos el Vertebrate Genomes Project (VGP), que es un proyecto internacional que tiene como objetivo secuenciar, durante la próxima década, las más de 70.000 especies de vertebrados que existen en la Tierra a día de hoy.
Todos estos años de trabajo han culminado en el artículo de Nature, donde ya hemos publicado 16 genomas completos.
De 16 a 70.000 hay una buena diferencia… ¿10 años serán suficientes?
El artículo es solo el pistoletazo de salida del proyecto, ya que lo que queríamos era dar a conocer el gold standard que hemos creado para secuenciar genomas de altísima calidad. Desde los inicios del proyecto se han ido haciendo pruebas y explorando técnicas, y podemos decir que ya hemos encontrado el método, es decir, la combinatoria de técnicas genómicas que nos permiten obtener genomas de referencia de manera suficientemente barata pero con una calidad excelente, casi libre de errores.
“Con el artículo queremos hacer un llamamiento para recomendar el uso de este conjunto de técnicas y así generar genomas de altísima calidad que sirvan a toda la comunidad científica”
Hemos empezado publicando 16 genomas porque la importancia del artículo no era el número sino el método para hacer estas secuenciaciones. Ahora ya estamos preparando el siguiente artículo con más de 130 especies, y el objetivo es intentar llegar a 500 a finales de año.
En en cuanto al tiempo, el factor limitante son las muestras: para muchas especies no hay material de buena calidad o es muy difícil conseguirlo. Si tuviéramos las muestras, técnicamente no tenemos problemas, y con distributed networks donde colaboraran laboratorios de todo el mundo, podríamos conseguirlo en diez años sin problemas.
“Animamos a cualquier grupo que tenga muestras para que nos contacte. Buscaremos la manera de financiar la colaboración y obtener datos de la misma calidad para poderlos comparar”
Dices que el nivel técnico no es un problema, pero conseguir estos genomas de altísima calidad no debe de ser fácil… ¿A qué retos os habéis enfrentado durante el proceso?
Una de las partes cruciales de este proyecto (y de la genómica en general) es saber montar las partes de un genoma de referencia. Para hacerlo, a partir de un grupo de células con el mismo ADN tenemos que ir leyendo una a una las bases que lo componen y, por lo tanto, no es un proceso sencillo.
Hemos estado muchos años trabajando en el aspecto técnico, pero el punto clave que nos ha permitido poner en marcha ahora el VGP y no antes, es que, en los últimos años, el campo de la genómica ha disfrutado de una gran revolución en la manera de montar estos genomas de referencia: ahora tenemos la habilidad técnica para leer todo el genoma de punta a punta y llegar a regiones del genoma que antes no podíamos leer.
“A la hora de leer y montar los genomas, hasta hace cuatro años era cómo si viéramos la televisión de los años 80 a 480p y ahora lo hiciéramos en 4K”
Esta habilidad de lectura, que hasta ahora estaba reservada al análisis del genoma humano o bien a organismos modelo para biomedicina (C. elegans, ratón…) la podemos aplicar ya al genoma de los vertebrados de manera generalizada.
Ahora que hablas de biomedicina… ¿Esta metodología que habéis desarrollado, se podría aplicar a otras ramas de la investigación o a la salud humana?
¡Y tanto! Uno de los motivos por los cuales insistimos tanto en la estandarización y en la calidad de los genomas que se generen en este proyecto es para poder compararlos con el genoma humano y así poder hacer interpretaciones, que creo será el reto de la genómica en el s. XXI.
Hay una gran cantidad de fragmentos de nuestro genoma que todavía no sabemos qué hacen, y aquí es donde la genómica comparativa nos puede ayudar, ya que todos los vertebrados compartimos miles de características (sistemas, evolución y desarrollo, cerebro…).
“Tener centenares o miles de genomas de vertebrados completos nos abre la puerta a comparar y poder hacer interpretación del genoma humano y las enfermedades”
Así, mientras generamos datos que sirvan para entender mejor el genoma humano, queremos crear genomas de referencia para la conservación de la biodiversidad, que es un tema crucial.
Con estos datos queremos facilitar el trabajo de las comunidades que trabajan con especies muy amenazadas porque puedan incluir de manera económica y sencilla la genómica dentro de sus políticas de conservación.
A nivel de conservación de la biodiversidad, ¿sentís que estáis en una carrera a contrarreloj con este proyecto?
La respuesta obvia es sí: mientras esperamos a que la tecnología exista, cada año desaparecen centenares de especies en el mundo. Por lo tanto es muy importante empezar, de manera paralela a estos esfuerzos de secuenciación, otros proyectos que ayuden a conservar por ejemplo líneas celulares viables de animales, y que contribuyan así a la conservación de la biodiversidad.
“Ya hay muchos casos de especies que sabemos que no volverán nunca porque no tenemos material vivo; lo que no guardemos ahora, es posible que no lo podamos hacer en un futuro cercano”
¿Qué importancia tiene la colaboración entre grupos en proyectos como el VGP?
Para que estos proyectos funcionen se necesita conocimiento multidisciplinar: zoología, taxonomía, bioinformática, filogenética… Son proyectos de gran envergadura que requieren la participación de centros y laboratorios de todo el mundo para poder avanzar hacia el objetivo común: la conservación de la biodiversidad.
Siguiendo esta línea, todos los datos generados por el VGP son de acceso abierto: los genomas están públicos, y lo único que pedimos es que nos contacten para explicarnos qué quieren hacer y que se esperen a publicar sus resultados, como mínimo, al mismo tiempo que nosotros y no antes, puesto que somos quienes hemos generado los genomas.
“Nuestra intención es ir colgando todos los genomas en bases de datos públicas a medida que los vayamos secuenciando”
Estos datos, por tanto, se podrían usar para otros proyectos ¿verdad?
¡Totalmente! De hecho VGP forma parte de otro proyecto todavía más ambicioso, que pretende secuenciar la totalidad del ADN de la Tierra: el Earth Biogenome Project (EBP).
Además, a nivel europeo se ha creado el European Reference Genome Atlas (ERGA) que es la asociación de 400 investigadores e investigadoras de diferentes ámbitos para secuenciar todos los organismos de Europa. El ERGA tiene diferentes nodos, como ERGA Spain, donde Rosa Fernández (IBE) es una de las dos representantes del proyecto.
¡Desde el IBE estáis muy implicados con estas iniciativas! Tu grupo, en concreto, ¿qué papel ha tenido en el VGP?
¡La verdad es que sí! Pero otros centros del Parque de Investigación Biomédica de Barcelona (PRBB), como el Centro Nacional de Análisis Genómico (CNAG)–Centro de Regulación Genómica (CRG) también han participado activamente. El CNAG-CRG es uno de los núcleos más importantes de Europa a nivel de secuenciación e Ivo Gut es uno de los autores del artículo, puesto que parte de los datos de Oxford Nanopore (una de las técnicas que se han utilizado) se han generado bajo su dirección.
Además, el CNAG-CRG ya se está posicionando dentro del ERGA para ser uno de los centros de producción de genomas que habrá en Europa, y lo hará con los estándares de calidad que nos hemos impuesto desde el VGP.
A nivel personal, estoy desde hace muchos años en el Scientific Council del proyecto, trabajando conjuntamente con otros 15 investigadores de todo el mundo. Así, además de estar en la dirección científica, con mi grupo hemos participado intelectualmente tomando decisiones, como las técnicas a utilizar o las especies que priorizaríamos, pero también de manera activa secuenciando parte de los genomas del VGP.
Para acabar: ¿podríamos decir que estamos en un buen momento para la genómica y la conservación de la biodiversidad?
Yo creo que sí, y la muestra de esto es que hay interés en que se haga incluso por parte de empresas: Oxford Nanopore, una de las grandes empresas de secuenciación, presentó un proyecto piloto, Org One, donde financiarán la secuenciación de long-reads (la parte más cara y más importante para obtener genomas de referencia) de especies en peligro crítico de extinción.
Ahora mismo, el balance entre tecnología y gasto económico es tan bueno que están surgiendo muchas de este tipo de iniciativas y como comunidad científica lo tenemos que aprovechar.
Rhie A. et. al. Towards complete and error-free genome assemblies of all vertebrate species (2021); Nature.