Eduard Sabidó Aguade es el jefe de la Unidad de Proteómica mixta entre el Centro de Regulación Genómica (CRG) y el Departamento de Ciencias Experimentales y de la Salud, Universidad Pompeu Fabra (DCEXS-UPF), y el responsable del programa formativo del proyecto PROTrEIN, empezado en enero de 2021.
Hablamos con él sobre esta interesante iniciativa para impulsar el machine learning en el ámbito de la proteómica, y sobre el futuro de la investigación de la mano de estas nuevas tecnologías.
¿Qué utilidad tiene el machine learning aplicado a la protèomica?
Las herramientas de aprendizaje automático (machine learning) y de visualización de datos están cobrando una importancia capital en muchos ámbitos de la investigación biomédica. Tienen un impacto especialmente importante en el tratamiento de datos complejos y altamente estructurados como los que genera la proteómica.
En los últimos años estas herramientas han facilitado aspectos como la identificación de proteínas y sus modificaciones, su integración con datos genómicos, y la estratificación de pacientes en grupos de riesgo, entre otros.
«Las herramientas de machine learning y visualización de datos permitirán avanzar en nuestro conocimiento sobre los procesos patológicos y de respuesta a tratamiento.»
¿Cuál es el objetivo del proyecto PROTrEIN?
PROTrEIN es una red europea de formación de estudiantes de doctorado, y cada uno de estos estudiantes realizará un proyecto de investigación en el campo de la proteómica computacional a lo largo de 4 años, hasta el 2024.
Tenemos 15 proyectos de investigación para 15 estudiantes de doctorado repartidos entre varias universidades europeas, centros de investigación e industria. Los temas van desde el desarrollo de nuevos algoritmos de interpretación de datos, hasta el análisis de redes de interacción molecular, integración de datos genómicos o el desarrollo de procesos de gamificación en la visualización de datos complejos.
¿Cuáles han sido los principales retos a la hora de definir el programa formativo?
El principal reto de PROTrEIN para garantizar una excelente formación ha sido combinar un programa altamente multidisciplinar que incluye formación avanzada en química analítica, biología molecular, aprendizaje automático y visualización de datos.
Esto ha estado posible gracias a la implicación de los expertos en estas disciplinas de una gran variedad de instituciones participantes y de entidades asociadas al proyecto.
Las metodologías que impulsa el proyecto PROTrEIN ¿han venido para quedarse?
Los contenidos de formación impulsados por PROTrEIN, como el desarrollo de herramientas de aprendizaje automático y de visualización de datos serán (y son) de gran interés para la investigación biomédica.
En pocos años todos los investigadores e investigadoras seremos usuarios de este tipo de algoritmos informáticos. No necesariamente todo el mundo tendrá que ser un desarrollador experto, pero los profesionales con este perfil y conocimientos tendrán un gran valor añadido en el ecosistema de la investigación.
«Los profesionales que sepan de este tipo de algoritmos tendrán un gran valor añadido en el ecosistema de la investigación.»
Eduard Sabidó (CRG)
¿Hasta dónde puede llegar la investigación de la mano de estas nuevas tecnologías?
Estamos en el inicio de la aplicación de las herramientas de aprendizaje automático en investigación. Esperamos un crecimiento exponencial en los próximos años, aunque cuesta valorar hasta dónde llegará su impacto.
En el caso concreto de la proteómica estas nuevas tecnologías cambiarán la forma de adquirir y analizar los datos, y nos permitirán avanzar en nuestro conocimiento sobre los procesos patológicos y de respuesta a tratamiento.