L’Eduard Sabidó Aguade és el cap de l’Unitat de Proteòmica mixta entre el Centre de Regulació Genòmica (CRG) i el Departament de Ciències Experimentals i de la Salut, Universitat Pompeu Fabra (DCEXS-UPF), i el responsable del programa formatiu del nou projecte PROTrEIN, començat al gener de 2021.
Parlem amb ell sobre aquesta interessant iniciativa per impulsar el machine learning a l’àmbit de la proteòmica, i sobre el futur de la recerca de la mà d’aquestes noves tecnologies.
Quina utilitat té el machine learning aplicat a la protèomica?
Les eines d’aprenentatge automàtic i de visualització de dades estan cobrant una importància cabdal en molts àmbits de la recerca biomèdica. Tenen un impacte especialment important en el tractament de dades complexes i altament estructurades com les que genera la proteòmica.
En els darrers anys aquestes eines han facilitat aspectes com la identificació de proteïnes i les seves modificacions, la seva integració amb dades genòmiques, i l’estratificació de pacients en grups de risc, entre d’altres.
“Ens permetrà avançar en el nostre coneixement sobre els processos patològics i de resposta a tractament.”
Quin es l’objectiu del projecte PROTrEIN?
El projecte PROTrEIN és una xarxa europea de formació d’estudiants de doctorat, i cadascun d’aquests estudiants realitzarà un projecte de recerca en el camp de la proteòmica computacional al llarg de 4 anys, fins al 2024.
Tenim 15 projectes de recerca per a 15 estudiants de doctorat repartits entre diverses universitats europees, centres de recerca i indústria, que abasten des del desenvolupament de nous algorismes d’interpretació de dades, a l’anàlisi de xarxes d’interacció molecular, integració de dades genòmiques i el desenvolupament de processos de gamificació en la visualització de dades complexes.
Quins han estat els principals reptes a l’hora de definir el programa formatiu?
El principal repte del projecte PROTrEIN per garantir una excel·lent formació ha estat combinar un programa altament multidisciplinar que inclou formació avançada en química analítica, biologia molecular, aprenentatge automàtic i visualització de dades.
Això ha estat possible gràcies a la implicació dels experts en aquestes disciplines d’una gran varietat d’entitats participants i d’entitats associades al projecte.
Les metodologies que impulsa el projecte PROTrEIN han vingut per quedar-s’hi?
Els continguts de formació impulsats pel projecte PROTrEIN, com el desenvolupament d’eines d’aprenentatge automàtic i de visualització de dades seran (i són) de gran interès per a la recerca biomèdica.
En pocs anys tots els investigadors serem usuaris d’aquest tipus d’algorismes informàtics. No necessàriament tothom n’haurà de ser un desenvolupador expert, però els professionals amb aquest perfil i coneixements tindran un gran valor afegit en l’ecosistema de recerca.
“Els professionals que sàpiguen d’aquest tipus d’algorismes tindran un gran valor afegit en l’ecosistema de recerca.”
Eduard Sabidó (CRG)
Fins on pot arribar la recerca de la mà d’aquestes noves tecnologies?
Estem als inicis de l’aplicació de les eines d’aprenentatge automàtic en recerca. Esperem un creixement exponencial en els propers anys, i costa valorar fins a on arribarà el seu impacte.
En el cas concret de la proteòmica aquestes noves tecnologies canviaran la forma com adquirim i analitzem les dades, i ens permetran avançar en el nostre coneixement sobre els processos patològics i de resposta a tractament.