Un importante paso hacia la compartición de datos genómicos humanos

Dos años después del nacimiento de la Federación de Archivos Europeos de Genomas y Fenomas (FEGA), se han hecho públicos los primeros conjuntos de datos (datasets) que, a pesar de estar almacenados a nivel nacional – en este caso en Polonia, Noruega y Suecia – son accesibles a nivel global a través del portal del EGA, con sede en el Parque de Investigación Biomédica de Barcelona (PRBB).

Estos conjuntos de datos tratan sobre temas tan diversos como metagenomas del intestino, transcriptómica de célula única en pacientes de una enfermedad autoinmune, el mapa genómico de toda una población o cánceres pediátricos. Y son todos accesibles para la comunidad científica, siguiendo las normas nacionales de cada nodo.

Una federación de datos genómicos

El FEGA se creó en 2022 como una extensión de la EGA (con sede en el EBI en Cambridge, UK y en el Centro de Regulación Genómica (CRG), Barcelona). Hoy en día ya son siete los países que han creado nodos nacionales para compartir metadatos de sus estudios con datos humanos genómicos (y de otros tipos) para que equipos científicos de todo el mundo puedan reutilizarlos de forma segura. La EGA les da apoyo: les ofrece su plataforma, así como formación y ayuda.

Así, después de años de mucho trabajo, se cumple lo que Arcadi Navarro, director del equipo EGA, decía durante el lanzamiento de FEGA: “Que cualquier investigador o investigadora pueda saber si existen estudios y datos de su interés, en cualquier lugar del mundo”.

«Hemos tardado, porque era importantísimo poner los cimientos correctamente, para tener una estructura duradera y segura, a nivel técnico y ético, y que pueda también aceptar las nuevas tecnologías que vayan viniendo», explica Teresa D’Altri, Project Management Coordinator en el EGA-CRG. “¡Pero ya tenemos los primeros conjuntos de datos de investigación!”, celebra.

GDI, the European Genomic Data Infrastructure

A nivel Europeo el proyecto GDI (Genomic Data Infraestructure), tiene como objetivo también dar acceso a datos genómicos, fenotípicos y clínicos de toda Europa. Está cofinanciado por la Comisión Europea y los países que participan.

«La idea se ha ido gestando y haciendo grande poco a poco», explica D’Altri. En 2018 se hizo una declaración política a nivel europeo para «secuenciar 1 millón de genomas humanos de diferentes ascendencias u orígenes«. Diferentes países se fueron sumando, y en 2020 se firmó el acuerdo para financiar lo que entonces se llamó B1MG (Beyond 1 milion genomes). Fue en 2022 cuando finalmente se empezaron a generar las infraestructuras para este proyecto – que finalmente se ha quedado con el nombre de GDI.

El proyecto lo gestiona ELIXIR Europa, quien pidió ayuda a EGA. “Somos una especie de ‘expertise providers’ del GDI. Al final ambos proyectos compartimos mucho. Es el mismo concepto: una estructura extendida formada por nodos locales y un portal común a nivel europeo”.

«FEGA y GDI compartimos el mismo concepto: una estructura extendida formada por nodos locales y un portal común a nivel europeo»
Teresa D’Altri (EGA-CRG)

De hecho, D’Altri explica que algunos países han decidido unir sus nodos de FEGA y de GDI. Por el momento, uno de los softwares que utilizará GDI está basado en uno creado en el EGA Barcelona.

¿Por qué tener tantos genomas?

El GDI no es el único proyecto de secuenciación de genomas humanos que existe. Hay otros similares en EEUU (All of us), en el continente africano (H3Africa) o en Asia (GenomeAsia 100K). Pero, ¿por qué necesitamos tantos genomas?

“Los datos genómicos humanos son muy ricos en información, tienen alta potencialidad y se pueden reutilizar muchísimas veces, para responder a diferentes preguntas científicas”, explica D’Altri.

Pero uno de los problemas que hay es la falta de diversidad. “Tenemos muchos genomas secuenciados, pero la mayor mayoría son de ascendencia europea. Nos falta una representación significativa de las demás ascendencias. De hecho, no sería tan problemático si tuviéramos más genomas africanos y menos europeos porque los africanos son mucho más diversos, y por tanto representan mejor la diversidad genética humana”, explica D’Altri.

Existe una falta de diversidad de los genomas que tenemos descritos; no existe una representación significativa de ascendencias distintas a la europea.

Estos proyectos – GDI, All of us, H3Africa, GenomeAsia 100K y otros – deberían ayudar a cerrar esta brecha. Sin olvidar la otra parte – la compartición de estos datos, como hace FEGA. A fecha de hoy (febrero de 2024), la red FEGA consta de siete nodos nacionales europeos, pero existen decenas de países que trabajan para establecer un nodo FEGA.

A medida que la red FEGA se vaya poblando con más y más datos, nos acercaremos a un recurso verdaderamente global para acelerar la búsqueda de enfermedades y mejorar la salud humana en áreas clave como el cáncer y las enfermedades raras – un tipo de investigación que se ve especialmente beneficiado por la compartición de datos a nivel global.

Sobre el autor/a

Maruxa Martínez-Campos es bióloga. Después de su doctorado en la Universidad de Cambridge se pasó al "otro lado" de la investigación. Fue editora de Genome Biology y, durante casi dos décadas, formó parte del departamento de comunicación del PRBB, donde lideró El·lipse como editora jefa hasta 2025. También coordinó el Grupo de trabajo de Buenas Prácticas Científicas y el Comité de Igualdad, Diversidad e Inclusión del PRBB.