Dos anys després del naixement de la Federació d’Arxius Europeus de Genomes i Fenomes (FEGA), s’han fet públics els primers conjunts de dades (datasets) que, tot i estar emmagatzemats a nivell nacional – en aquest cas a Polònia, Noruega i Suècia – són accessibles a nivell global a través del portal de l’EGA, amb seu al Parc de Recerca Biomèdica de Barcelona (PRBB).
Aquests conjunts de dades tracten sobre temes tan diversos com metagenomes de l’intestí, transcriptòmica de cèl·lula única en pacients d’una malaltia autoimmune, el mapa genòmic de tota una població o càncers pediàtrics. I són tots accessibles a la comunitat científica, seguint les normes nacionals de cada node.
Una federació de dades genòmiques
El FEGA es va crear el 2022 com una extensió de l’EGA (amb seu a l’EBI a Cambridge, UK i al Centre de Regulació Genòmica (CRG), Barcelona). Avui en dia ja són set els països que han creat nodes nacionals per tal de compartir metadades dels seus estudis amb dades humanes genòmiques (i d’altres tipus) per tal que equips científics de tot el món les puguin reutilitzar de manera segura. L’EGA els dóna recolzament: els ofereix la seva plataforma, així com formació i suport.
Així, després d’anys de molta feina, es cumpleix el que Arcadi Navarro, director de l’equip EGA, deia durant el llançament de FEGA: “Que qualsevol investigador o investigadora pugui saber si existeixen estudis i dades del seu interés, a qualsevol lloc del món”.
“Hem trigat, perquè era importantíssim posar els ciments correctament, per tal de tenir una estructura duradera i segura, a nivell tècnic i ètic, i que pugui també acceptar les noves tecnologies que vagin venint”, explica Teresa D’Altri, Project Management Coordinator a l’EGA-CRG. “Però ja tenim els primers conjunts de dades de recerca!”, celebra.
GDI, the European Genomic Data Infrastructure
A nivell Europeu el projecte GDI (Genomic Data Infraestructure), té com objectiu també donar accés a dades genòmiques, fenotípiques i clíniques de tota Europa. Està cofinançat per la Comisió Europea i els paisos que hi participen.
“La idea s’ha anat gestant i fent gran a poc a poc”, explica D’Altri. El 2018 es va fer una declaració política a nivell europeu per “sequenciar 1 milió de genomes humans de diferents ascendències o orígens”. Diferents països es van anar sumant, i el 2020 es va signar l’acord per finançar el que aleshores es va anomentar B1MG (Beyond 1 milion genomes). El 2022 va ser quan finalment es va començar a generar les infraestructures amb aquest projecte – que finalment s’ha quedat amb el nom de GDI.
El projecte el gestiona ELIXIR Europa, qui va demanar ajuda a EGA. “Som una mena de ‘expertise providers’ del GDI. Al final tots dos projectes compartim molt; és el mateix concepte: una estructura extesa formada per nodes locals i un portal comú a nivell europeu”.
“FEGA i GDI compartim el mateix concepte: una estructura extesa formada per nodes locals i un portal comú a nivell europeu”
Teresa D’Altri (EGA-CRG)
De fet, D’Altri explica que alguns països han decidit unir els seus nodes de FEGA i de GDI. De moment, un dels softwares que utilitzarà GDI està basat en un creat a l’EGA Barcelona.
Perquè calen tants genomes?
El GDI no és l’únic projectes de seqüenciació de genomes humans que existeix. Hi ha d’altres semblants a EEUU (All of us), al continent africà (H3Africa) o a Àsia (GenomeAsia 100K). Però, perquè ens calen tants genomes?
“Les dades genòmiques humanes son molt riques en informació, tenen alta potencialitat i es poden reutilitzar moltíssimes vegades, per respondre diferents preguntes cientifiques”, explica D’Altri.
Un dels problemes que hi ha és la manca de diversitat. “Tenim molts genomes seqüenciats, però la gran majora son d’ascendència europea. Ens falta una representació significativa de les altres ascendències. De fet, no seria tan problemàtic si tinguessim més genomes africans i menys europeus perquè els africans son molt més diversos, i per tant representen millor la diversitat genètica humana”, explica d’Altri.
Hi ha una manca de diversitat dels genomes que tenim descrits; no hi ha una representació signifiativa d’ascendències diferents a l’europea.
Aquests projectes – GDI, All of us, H3Africa, GenomeAsia 100K i d’altres – haurien d’ajudar a tancar aquesta bretxa. Sense oblidar l’altra part – la compartició d’aquestes dades, com fa FEGA. A data d’avui (febrer de 2024), la xarxa FEGA consta de set nodes nacionals europeus, però hi ha desenes de països que treballen per establir un node FEGA.
A mesura que la xarxa FEGA es vagi poblant amb més i més dades, ens aproparem a un recurs veritablement global per accelerar la recerca de malalties i millorar la salut humana en àrees clau com el càncer i les malalties rares – un tipus de recerca que es veu especialment beneficiat per la compartició de dades a nivell global.