Conocí a Mar Albà en octubre del 2013 cuando empezaba el máster en Bioinformática en la Universitat Pompeu Fabra. Fue la profesora de un curso llamado Principios de la Bioinformática del Genoma, donde aprendimos algunos de los conceptos básicos esenciales de la bioinformática, además de obtener una formación práctica.
Cuando llegó el momento de elegir un proyecto para mi tesis de máster, decidí unirme al laboratorio de Mar después de escuchar su investigación para averiguar como nacen los genes de novo. Mar me sugirió que leyera un artículo muy interesante llamado «Proto-genes and de novo gene birth«, que proponía que centenares de genes de novo jóvenes de la levadura podrían tener un potencial adaptativo real. Me cautivó el misterio que rodeaba estos genes de novo y las posibles profundas consecuencias evolutivas de su existencia.
«Me cautivó el misterio que rodeaba estos genes de novo y las posibles profundas consecuencias evolutivas de su existencia»
Will Blevins
Para mi proyecto de tesis, Mar propuso que podríamos hacer experimentos para hacer un seguimiento de los hallazgos del paper «Proto-genes …»: si pudiéramos recrear los transcriptomas desde cero de una docena de especies de levadura muy relacionadas, podríamos compararlas y profundizar todavía más en la cuestión de donde provenían estos genes de novo jóvenes.
Más buena que el pan; la levadura como sistema modelo
Empecé a aprender más sobre la levadura, ya que solo sabía algunas cosas; sabía que era un eucariota unicelular del reino de los hongos y que ¡se utilizaba para hacer pan! Aun así, rápidamente supe que la levadura de panadero (Saccharomyces cerevisiae es su nombre científico) se podía utilizar para mucho, mucho más que para hacer pan.
Me impresionó como un organismo tan «sencillo» con solo ~ 6.000 genes había desarrollado respuestas tan ingeniosas y específicas a las condiciones ambientales cambiantes. Después de leer más sobre S. cerevisiae, todavía no comprendía del todo el poder real de los experimentos que se pueden diseñar con un eucariota que se manipula tan fácilmente en el laboratorio. Aquí fue donde empezó nuestra colaboración con el grupo de Single Cell Behavior de Lucas Carey, del Departamento de Ciencias Experimentales y de la Salud, Universidad Pompeu Fabra (DCEXS-UPF), puesto que ni Mar ni yo teníamos mucha experiencia diseñando nuestros propios experimentos con levadura.
«Me siento muy afortunado de que en el Parque de Investigación Biomédica de Barcelona (PRBB) haya un espíritu de colaboración abierta, que nos ayuda a investigar mejor y nos hace a todos mejores investigadores.»
Will Blevins
Juntos, empezamos a planificar los experimentos, intentando averiguar la logística y los costes. A causa de la cantidad de ARN purificado que necesitábamos para poder reconstruir el transcriptoma de cada especie desde cero, no podríamos hacer nuestros experimentos en placas de 96 pozos (cosa que nos habría facilitado MUCHO todo, puesto que se pueden automatizar muchos de los pasos).
De la teoría a la práctica: qué puede aprender un biólogo computacional en un laboratorio
En mi primer día en el laboratorio, se me cayó la caja “Yeast Stock Box #1”, enviando una docena de tubos criogénicos por los aires, con unos cuántos tubos astutos escondiéndose bajo la poyata del laboratorio. [Para traducir esto en términos computacionales, seria como dejar caer un disco duro externo que contenía la única copia de los datos en bruto de los últimos 3 años de vuestros proyectos.]
Afortunadamente, pudimos encontrar todos los tubos y devolverlos al congelador antes de que se pudieran descongelar, pero fui *muy* consciente de la importancia de tener copias de seguridad físicas… Al fin y al cabo, no hay CTRL + Z en el laboratorio!
Lorena Espinar tuvo la amabilidad de guiarme paso a paso por los protocolos, pasando de células congeladas a ARN purificado, cosa que realmente me ayudó a entender mejor los datos de secuenciación en bruto y las posibles fuentes de sesgo.
Experimenté de primera mano algunas de estas fuentes habituales de sesgo que las personas del mundo computacional pocas veces encontramos:
- contaminación del medio (¿has abierto la botella sin la llama?)
- efecto lote (¿alguien apagó el agitador durante la noche?)
- muestras mal etiquetadas (¿quién ha puesto esta fila en la hoja de cálculo?)
- datos que faltan (¿dónde está el post-it que usé para escribir las lecturas OD600?)
Afortunadamente, después de varios meses de modificar y perfeccionar nuestros experimentos, generamos varios gránulos de ARN purificado para cada una de nuestras muestras.
«Experimenté de primera mano algunas fuentes de sesgo que como investigador computacional raramente había encontrado: contaminación de muestras, efecto lote, muestras mal etiquetadas, datos que faltan…»
Will Blevins
¡Accede al artículo completo en la versión en inglés!
Si quieres seguir leyendo la interesante experiencia de Will Blevins y descubrir el final de su tesis, accede a la versión original (en inglés), haciendo click aquí.
Blevins WR, Ruiz-Orera J, Messeguer X, Blasco-Moreno B, Villanueva-Cañas JL, Espinar L, Díez J, Carey LB, Albà MM. Uncovering de novo gene birth in yeast using deep transcriptomics. Nat Commun, 2021; 12(1): 604. PMID: 33504782 . DOI: 10.1038/s41467-021-20911-3.