Un modelo de IA innovador llamado popEVE, desarrollado por investigadores de la Facultad de Medicina de Harvard y del Centro de Regulación Genómica (CRG), promete transformar el diagnóstico de enfermedades genéticas raras o minoritarias. PopEVE utiliza datos evolutivos de cientos de miles de especies, así como datos de variación genética en la población humana, para identificar mutaciones en proteínas humanas que pueden causar enfermedades, incluso aquellas que nunca se han visto antes. Al comparar las secuencias de proteínas humanas con otras especies, popEVE identifica qué partes de las aproximadamente 20.000 proteínas humanas son esenciales para la vida y cuáles pueden tolerar mutaciones. Esto permite que el modelo no sólo detecte posibles mutaciones causantes de enfermedades, sino que también clasifique su gravedad, ofreciendo a los médicos una nueva herramienta para priorizar las mutaciones más peligrosas del genoma de un paciente.
Durante miles de millones de años, la evolución en la Tierra ha llevado a cabo innumerables experimentos, probando qué cambios puede tolerar una proteína y cuáles son demasiado perjudiciales para sobrevivir.
Este modelo es particularmente vital para las enfermedades raras, donde la mitad de los pacientes nunca recibe un diagnóstico claro. A diferencia de los métodos tradicionales que se basan en grandes cohortes de pacientes, popEVE trabaja con datos genéticos individuales, haciéndolo más rápido, sencillo y accesible, especialmente en sistemas sanitarios con recursos limitados. Al identificar con precisión las mutaciones nocivas, incluso en casos en los que no existen datos previos, popEVE puede ayudar a los médicos a tomar decisiones más informadas sin necesidad de ADN parental ni de historiales genéticos extensos, dice Mafalda-Dias, del CRG y una de las líderes del estudio. En las pruebas realizadas, popEVE identificó correctamente las mutaciones de enfermedades conocidas el 98% de las veces y descubrió nuevos genes candidatos relacionados con trastornos del desarrollo.
Además, popEVE aborda el problema de la falta de representación y diversidad en las bases de datos genéticas, donde la mayoría de los datos provienen de ascendencia europea. Al preguntarse si una mutación se ha visto antes en humanos, independientemente de si es una vez en una población específica o mil veces en poblaciones europeas sobrerrepresentadas, garantiza que todas las poblaciones sean consideradas por igual, independientemente de su ascendencia.
«Nadie debería obtener un resultado alarmante sólo por que su comunidad no esté bien representada en las bases de datos globales. popEVE ayuda a solucionar ese desequilibrio, que ha existido en el campo durante mucho tiempo»
Jonathan Frazer, co-líder del artículo (CRG)
En el estudio, popEVE descubrió 123 mutaciones que nunca antes se habían relacionado con trastornos del desarrollo; 104 de éstas se observaron en sólo uno o dos pacientes.
Este desarrollo promete revolucionar los diagnósticos genéticos, haciéndolos más equitativos y eficientes.
Orenbuch, R., Shearer, C.A., Kollasch, A.W. et al. Proteome-wide model for human disease genetics. Nat Genet (2025). https://doi.org/10.1038/s41588-025-02400-1



