Imprimir Republish

Tapa

La era de la secuenciación completa de genomas

Nuevas técnicas alteran la manera de interpretar el material genético y podrán transformar la comprensión de las enfermedades, de la diversidad genética humana, de la producción de alimentos y de los procesos evolutivos

Los genes de los distintos organismos son en gran medida similares; alrededor de un 0,01 % del genoma diferencia a los seres humanos entre sí

Felipe Mayerle

Imagínate que, al salir con alguien que no conocías, quieras comprobar si es cierto que esa persona es de ascendencia italiana, por ejemplo. Solo tienes que aprovechar una distracción, pasar un hisopo por el borde del vaso, poner la muestra de ADN en el secuenciador que llevas en el bolsillo, conectarlo al teléfono móvil y, en minutos, tienes la respuesta. ¿Suena a ciencia ficción? No tanto: ya existen dispositivos en miniatura que leen material genético en tiempo real y pueden utilizarse para identificar patógenos causantes de enfermedades. Este dispositivo forma parte de la revolución genómica que ahora permite secuenciar el material genético completo cada vez en menos tiempo, con menos errores y a un costo menor.

Cualquiera que era adulto hace 20 años probablemente recuerde la era del genoma, cuando se dieron a conocer las secuencias completas de una serie de organismos, entre los que descolló el Proyecto Genoma Humano (PGH), cuya secuencia casi completa se anunció en 2001. Grandes iniciativas – algunas de ellas financiadas en Brasil por la FAPESP (lea en Pesquisa FAPESP, edición nº 174) – desentrañaron el material genético de organismos como la bacteria Xylella fastidiosa, causante de la clorosis variegada de los cítricos (CVC), que ataca a los naranjos, y de diversas formas de cáncer, lo que les dio impulso a los laboratorios de genética y al desarrollo del potencial de la bioinformática.

Desde entonces, estos datos han estado a disposición de la comunidad científica y las investigaciones han permitido identificar una infinidad de genes asociados con problemas de salud, pero aún con un impacto limitado en la vida de los pacientes (lea en Pesquisa FAPESP, edición nº 284), especialmente en el caso de enfermedades complejas, como la diabetes o el cáncer, que implican la acción de muchos de estos tramos de material genético encargados de producir proteínas.

“El Proyecto Genoma Humano inauguró la genética moderna”, afirma el bioinformático Pedro Galante, coordinador del laboratorio de bioinformática del Instituto de Enseñanza e Investigación del Hospital Sírio-Libanês (IEP-HSL), de São Paulo. “Hemos descubierto muchos genes asociados a una diversidad de características”. El biólogo molecular Carlos Menck, del Instituto de Ciencias Biomédicas de la Universidad de São Paulo (ICB-USP), informa que el uso de la secuenciación de nueva generación, hace alrededor de una década, supuso una enorme diferencia para el diagnóstico de la enfermedad conocida como xerodermia pigmentosa [XP], cuyos pacientes no pueden exponerse al sol (lea en Pesquisa FAPESP, edición nº 323 y en el apartado abajo). “Pronto publicaremos un artículo con las mutaciones detectadas en 150 pacientes”, comenta. También vislumbra la posibilidad de que estos conocimientos puedan dar lugar a tratamientos basados en la edición o la regulación de genes mediante herramientas como Crispr-Cas9 y ARN de interferencia.

La nueva oncología
(haz click para aprender mas)

A juicio de Pedro Galante, del IEP-HSL, hoy en día la oncología se encuentra en un nivel muy diferente en comparación con lo que era hace unos pocos años, y ahora los progresos son mucho más rápidos. Ya es posible orientar tratamientos agresivos – y sumamente caros – hacia aquellos pacientes que cuenten con mayores posibilidades de beneficiarse, en función de las características del perfil de las mutaciones de los tumores y del sistema inmunitario del paciente, por ejemplo. “Esto ha sido posible gracias a los descubrimientos de los últimos cinco años”.

Un ejemplo publicado este año en la revista científica Cancers fue el hallazgo en las células de la leucemia mieloide aguda – un tipo de cáncer para el que aún no se dispone de un tratamiento satisfactorio – de un alto nivel de actividad en 19 genes de los receptores olfativos, normalmente implicados en la detección de los olores. Ha sido un descubrimiento sorprendente, que puede ayudar al diagnóstico precoz de la enfermedad y, tal vez, revelar potenciales blancos terapéuticos.

Los tumores de piel que padecen los portadores de la enfermedad xerodermia pigmentosa presentan un aumento en la inserción de los elementos transponibles, los retrotransposones, según un artículo publicado en mayo por el grupo de Carlos Menck, del ICB-USP, en la revista Carcinogenesis. “Hemos sido los primeros en demostrarlo, gracias a una herramienta bioinformática desarrollada por Pedro Galante”, dice Menck. El estudio indica que estas inserciones causan inestabilidad en el genoma y pueden ser el origen del desarrollo de tumores, e identificó una enzima que cumple un rol importante en el mantenimiento de la estabilidad. “Ahora estamos investigando su mecanismo de acción”.

La manera de mirar hacia el genoma ahora está cambiando radicalmente, al dirigirse no solamente a un porcentaje muy pequeño de genes a los que se consideraba esenciales, sino también a la secuencia completa del ADN para comparar a una gran cantidad de individuos e incluso especies. Es un momento que entusiasma. En mayo, Galante asistió al congreso The Biology of Genomes, que se llevó a cabo en el laboratorio Cold Spring Harbor de Estados Unidos, el más importante del área. Y relata que, en la conferencia de clausura, el genetista estadounidense Evan Eichler, de la Universidad de Washington, declaró que llevaba años esperando el momento en el que ahora se encuentra su campo. Hay expectativa por el saldo adelante que impulsará la investigación genómica, especialmente en el área de la salud.

Léo Ramos Chaves/Revista Pesquisa FAPESPMáquinas de secuenciación: flow cell en la cual se insertan las muestras en el equipo Illumina NovaSeq (abajo); en el método Sanger, el ADN pasa a través de unas finas hebras (a la der.)Léo Ramos Chaves/Revista Pesquisa FAPESP

Una de las limitaciones del PGH fue que, a pesar de haber recopilado material de unos 20 voluntarios, alrededor de un 70 % del genoma secuenciado procedía de una sola persona, un estadounidense de ascendencia europea y africana de la ciudad de Buffalo, en el estado de Nueva York. Esto significa que las variantes genéticas que difieren entre una y otra población pueden no estar representadas en este que aún hoy en día es el genoma de referencia. Es con base en este que los investigadores comparan sus resultados para identificar la función y la variación de los genes detectados en situaciones diferentes.

Ahora, un consorcio internacional, el Pangenoma Humano, se propone resolver este dilema llevando a cabo la secuenciación completa de al menos 350 personas de todos los rincones del planeta, de modo que ya no exista tan solo una referencia. “Si tuviéramos referencias genómicas de la población brasileña para comparar con lo que vemos en nuestros pacientes sería mucho mejor, porque las variantes que aquí son comunes podrían no estar presentes en la población estadounidense o viceversa”, explica Galante, quien ha solicitado su incorporación al consorcio para aportar sus conocimientos en bioinformática.

La promesa es realizar lo que se conoce como secuenciación de telómero a telómero (T2T), aludiendo a los extremos de los cromosomas, cuyas secuencias altamente repetitivas dificultan su desentrañamiento con base en los métodos anteriores. Para ello, la estrategia ha consistido en combinar técnicas. Los dispositivos de la empresa británica Oxford Nanopore y los de la estadounidense Pacific Biosciences han conseguido leer tramos de ADN sumamente extensos, de hasta millones de bases, un procedimiento eficaz para la ensambladura del genoma. “Las lecturas largas permiten determinar el andamiaje del genoma”, explica la genetista Glória Franco, de la Universidad Federal de Minas Gerais (UFMG). No en vano, la revista Nature ha destacado a la lectura larga como “método del año” de 2022, en un editorial publicado en enero de este año. Como el índice de error es mayor, los genetistas utilizan para refinar las secuencias las lecturas más cortas realizadas por las máquinas de la empresa californiana Illumina, que permiten observar tramos más pequeños con mayor precisión.

Autismo
(haz click para aprender mas)

Los estudios genómicos en los cuadros de autismo han apuntado variantes genéticas asociadas a este trastorno y a retrasos en el desarrollo, según consta en un estudio publicado en 2022 en la revista Nature Genetics, que contó con la participación de Maria Rita Passos-Bueno, del Centro de Estudios del Genoma Humano. La estrategia parece ser prometedora para comprender mejor las bases neurobiológicas del trastorno del espectro autista (TEA).

En el afán por entender los factores hereditarios, o los efectos de la edad de los padres en el nacimiento de niños con TEA, parece ser prometedor un análisis que considera tres generaciones de cada familia, en lugar de estudios poblacionales más amplios. Un artículo elaborado en el CEGH-USP, que informa sobre el análisis realizado con 33 familias, publicado este año en la revista Genetics, avala este enfoque, aunque lo reducido de la muestra todavía resulta insuficiente como para extraer conclusiones de peso.

Hasta hace poco, la secuenciación se realizaba en pequeños fragmentos que había que ensamblar, como un rompecabezas que puede tener piezas superpuestas (véase la infografía más abajo). Los tramos repetitivos, que abundan en el genoma, son particularmente difíciles de incluir en el montaje y acaban quedando fuera: en la representación de las bases nitrogenadas que componen el ADN –A, T, C y G–, puede darse el caso de una larga secuencia de ATATATATATAT, por ejemplo.

Alexandre Affonso / Revista Pesquisa FAPESP

Las iniciativas van mucho más allá de los genomas humanos, como ha puesto de relieve en enero la revista Science, entre los temas que serían noticia este año. El Earth Biogenome Project (EBP), un consorcio constituido en 2022 que reúne a científicos de diversos países, propone secuenciar todas las especies –incluido la gran proporción aún desconocida por la ciencia, sobre todo de seres unicelulares y pequeños invertebrados– en un lapso de 10 años. El objetivo es “el conocimiento, la utilización y la conservación de la biodiversidad”. Bajo este paraguas figuran otros proyectos, entre ellos la secuenciación de todos los mamíferos (Zoonomia, lea en Pesquisa FAPESP, edición nº 328) y de los primates (lea en Pesquisa FAPESP, edición nº 329).

La bioinformática brasileña Marcela Uliano-Silva, del Instituto Wellcome Sanger, del Reino Unido, forma parte del Darwin Tree of Life, que pretende descifrar el genoma de todos los organismos del Reino Unido. Ella justifica la necesidad de esta mirada amplia: “En la biología todo es investigación basada en la comparación”. Son unas 70.000 especies, de las cuales 1.000 ya están secuenciadas casi por completo. “En total tenemos alrededor de 2.700 genomas en algún punto del proceso”, calcula. Mientras se van generando, los datos ya quedan disponibles para su análisis por cualquiera que esté interesado. “El primer gran bloque de secuenciación fue el de los lepidópteros, la familia que incluye a las mariposas y las polillas”, comenta la bioinformática.

Diabetes y metformina
(haz click para aprender mas)

El principal tratamiento oral para controlar la glucemia en los pacientes con diabetes tipo 2 es la metformina, pero su mecanismo de acción sigue albergando misterios y, en este contexto, solo se han estudiado los genes codificantes de proteínas. El grupo de Glória Franco, de la UFMG, ha investigado formas de las moléculas de ARN largo no codificante (lncRNA, por sus siglas en inglés), según un artículo publicado en 2022 en la revista científica Non-coding RNA. La conclusión, por el momento preliminar, de que el fármaco regula formas críticas de lncRNA que pueden afectar la respuesta al tratamiento, como así también la proliferación celular y el metabolismo energético de las células, puede ser prometedora en la investigación de su funcionamiento.

Franco participó en los primeros proyectos genómicos que trabajaron con el ADN del helminto Schistosoma mansoni, causante de la esquistosomiasis, y actualmente está interesada en la relación entre el lncRNA y el cáncer, y la respuesta a los fármacos.

En busca de la diversidad más allá de la genética, Uliano-Silva también integra la comisión de Justicia, Equidad, Diversidad e Inclusión del EBP que apunta entre otras cosas a evitar una “neocolonización científica” como consecuencia de la preponderancia de los países más ricos en estos grandes consorcios internacionales. En este rol, ha sido contactada por investigadores brasileños interesados en sumarse a este tipo de proyectos y promueve la organización de iniciativas similares locales.

Un proyecto en su etapa inicial en Brasil se propone realizar la secuenciación de todos los tetrápodos (vertebrados con cuatro extremidades) del país, una iniciativa del primatólogo Jean Boubli, de la Universidad de Salford, en el Reino Unido, en colaboración con el grupo del Centro de Estudios del Genoma Humano de la USP (CEGH-USP). “Trabajamos con un secuenciador Illumina NovaSeq 6000”, explica la genetista Maria Rita Passos-Bueno, en referencia a uno de los equipos más modernos. Aunque el CEGH se centra en el estudio de las enfermedades genéticas raras, ella está entusiasmada con el nuevo proyecto. “Estamos organizando la recolección de muestras con el Museo de Zoología de la USP, en donde se cotejará la calidad de las muestras antes de enviárnoslas”. En una prueba inicial, se secuenciaron con éxito 70 muestras de aves. “Estoy interesada en el uso de los datos de primates no humanos para entender el genoma humano”, dice, volviendo a su interés principal. “Si hallamos una variante en humanos que es común en otros animales, hay grandes posibilidades de que ella no esté detrás de los problemas”, explica.

Ana Cotta / Wikimedia Commons | Frank Fox / Wikimedia Commons | Eduardo Cesar / Revista Pesquisa FAPESP | Michael Wolf / Wikimedia Commons | Zeynel Cebeci / Wikimedia Commons | rufus46 / Wikimedia CommonsUn ocelote, un aguará guazú, un protozoo, un arroz, un tomate y una mariposa: organismos muy diferentes pueden tener genes similares y los transposones contribuyen a generar variacionesAna Cotta / Wikimedia Commons | Frank Fox / Wikimedia Commons | Eduardo Cesar / Revista Pesquisa FAPESP | Michael Wolf / Wikimedia Commons | Zeynel Cebeci / Wikimedia Commons | rufus46 / Wikimedia Commons

Agricultura genómica
(haz click para aprender mas)

La pangenómica ya está presente en los principales cultivos responsables de la alimentación de la humanidad. Se sabe que algunas plantas experimentan naturalmente duplicaciones completas del genoma, dejando varias copias del ADN en sus células. Este proceso eleva las posibilidades de generar elementos transponibles – y, por lo tanto, nuevas respuestas a las condiciones ambientales –, según un artículo publicado en 2021 en la revista Genome Biology por el biólogo brasileño Rafael Della Coletta, estudiante de doctorado en la Universidad de Minnesota (EE. UU.).

Los transposones están detrás de algunos cambios, tales como la represión del funcionamiento del gen que estimula la floración del maíz cuando los días son más largos, la inducción de la tolerancia al aluminio en el arroz y la generación del formato ovalado en los tomates de la variedad roma. Según el artículo, la identificación de la relación causal entre los cambios en el fenotipo (las características de un organismo observables) y las novedades genómicas, que pueden alterarse mediante la edición de genes en función de las necesidades de producción agrícola, representaría una nueva era en la domesticación de las plantas comestibles.

Pero la posibilidad de obtener una infinidad de genomas completos no es ni el avance más importante de la nueva genómica. Lo crucial ha sido darse cuenta de que centrarse en los genes que producen proteínas limita el foco a tan solo el 1,2 % del ADN humano. Por lo que a ellos respecta, las personas son iguales en un 99,9 %. La mayor parte del genoma consta de secuencias que controlan y articulan la acción de los genes y que son las verdaderas responsables de las diferencias entre los organismos, en gran medida, debido a la acción de las moléculas de ARN con funciones reguladoras. Este es uno de los conceptos del área conocida como “evo-devo” (biología evolutiva del desarrollo, lea en Pesquisa FAPESP, edición nº 152): a lo largo del desarrollo, los ajustes en la construcción de las mismas estructuras pueden generar resultados muy diferentes, como la mano de una persona y el ala de un murciélago. “El hardware es el mismo, lo que cambia es el software”, compara el genetista molecular Paulo Amaral, del Insper. “La esponja marina que utilizamos para fregarnos, tiene genes muy similares a los nuestros”.

Alexandre Affonso / Revista Pesquisa FAPESP

La comprensión de que las pequeñas moléculas de ARN desconectan los genes (lea en Pesquisa FAPESP, edición nº 133) les valió a los estadounidenses Andrew Fire y Craig Mello el Premio Nobel de Fisiología o Medicina de 2006. Con las nuevas técnicas que han surgido desde entonces, su acción se ha puesto de manifiesto cada vez más. “Por primera vez estamos produciendo genomas completos, incluyendo las partes no codificantes, así como el ARN que ellas producen”, dice Amaral.

Este año, en colaboración con el genetista australiano John Mattick, de la Universidad de Nueva Gales del Sur (Australia), él ha publicado el libro intitulado RNA – The epicenter of genetic (CRC Press). La base de la obra, posteriormente ampliada y actualizada, fue la revisión que lo recluyó por tres meses en la biblioteca durante su doctorado, defendido en 2011 en la Universidad de Queensland, también en Australia, en el que por entonces era el laboratorio de Mattick. El volumen hace un repaso de la historia de la biología molecular desde el siglo XIX hasta los días actuales, con eje en el dilema que atrajo a Amaral desde su época de estudiante de grado: la supuesta función principal del ARN que era traducir los genes en proteínas. Entonces, ¿por qué la mayor parte del genoma humano representa instrucciones para moléculas de ARN que no producen proteínas? Existen ejemplos significativos como el gen Xist, que produce ARN largos, responsables del silenciamiento de uno de los dos cromosomas X en las células femeninas de los mamíferos, y está implicado en enfermedades como el cáncer. Junto con el grupo del inmunólogo Helder Nakaya, del Hospital Israelita Albert Einstein de São Paulo, Amaral ha estudiado la acción del ARN no codificante en la producción de la respuesta inmunitaria a las vacunas o en enfermedades cardiovasculares y neurológicas. En definitiva, el libro eleva al ARN al sitial de “motor computacional de la célula, del desarrollo, de la cognición y de la evolución”. “Estamos redactando las actualizaciones para una segunda edición”, revela. Los descubrimientos científicos están avanzando más rápido que el proceso editorial.

Es así que están adquiriendo cada vez más protagonismo los elementos genéticos transponibles (lea en Pesquisa FAPESP, edición nº 246) o transposones, descritos por primera vez en la década de 1940 por la genetista estadounidense Barbara McClintock como los responsables de la variación de color de los granos de las mazorcas de maíz, que suelen presentar secuencias repetitivas. Se trata de tramos replicados que pueden saltar e insertarse en otro segmento de la cadena del ADN, ejerciendo influencia sobre los genes vecinos con agilidad para sufrir alteraciones y generar novedades.

Alexandre Affonso / Revista Pesquisa FAPESP

Un artículo reciente redactado por el grupo de Galante, depositado en febrero en el repositorio BioRxiv, ha investigado el origen del ARN regulador a partir de elementos genéticos transponibles, los genes denominados retrocopias, en primates. Cinco de las 17 moléculas estudiadas se mantienen invariables en todos los primates, mientras que otras dos son específicas del genoma humano y pueden estar involucradas en procesos biológicos esenciales, tales como el metabolismo, la comunicación entre las células y el desarrollo de varios tipos de cáncer. “La línea que separa los elementos transponibles de los genes es cada vez más difusa”, celebra la botánica Marie-Anne van Sluys, quien consideraba que se le había retaceado importancia al tema, a pesar de que ella se ha venido centrando en él durante décadas, y actualmente dirige un estudio sobre genes, genomas y elementos transponibles en la caña de azúcar y su asociación en la interacción con patógenos. Un estudio realizado por su grupo y depositado en 2020 en el repositorio bioRxiv identificó un elemento genético transponible capaz de modular el desarrollo y la expresión génica en las plantas de tabaco como respuesta al estrés. “En los mamíferos, ya estaba claro que estos se destacan como motores de la diversificación”.

Los resultados también incluyen las marcas epigenéticas (como los patrones de metilación) que regulan el funcionamiento del ADN sin alterar su secuencia e indican cómo interactúan los genes con el ambiente (véase la infografía superior). Estas pueden estar detrás de ciertos tipos de tumores y su detección en el ADN circulante en el torrente sanguíneo ha demostrado ser una herramienta de diagnóstico prometedora y práctica, la llamada biopsia líquida, desarrollada en los últimos años (lea en Pesquisa FAPESP, edición nº 253).

Genómica brasileña
(haz click para aprender mas)

Las iniciativas nacionales, con el apoyo de la FAPESP, han mantenido al país en sintonía con lo que venía haciéndose en el extranjero. La secuenciación de la bacteria Xylella fastidiosa, iniciada en 1997, congregó a 35 laboratorios y 191 investigadores de instituciones paulistas en el ámbito de la Red de Organización para la Secuenciación y el Análisis de Nucleótidos (Onsa). Fue la primera secuenciación comercialmente relevante de un organismo causante de una enfermedad en las plantas, que ganó la portada de la revista Nature el 13 de julio de 2000.

También a principios de siglo se completaron exitosamente otros proyectos como el Genoma Caña de Azúcar, el Genoma del Cáncer y el de la bacteria Xanthomonas citri, causante del chancro cítrico.

Los resultados, fundamentales para el establecimiento de una cultura científica contemporánea, abarcaron la creación de decenas de laboratorios, la articulación entre grupos de investigación, el establecimiento de bases de datos compartidas y el desarrollo de la bioinformática. También inspiraron la creación de grupos de investigación en todo el país.

“La constitución de la red Onsa fue una iniciativa muy audaz y riesgosa, que fluyó muy bien y generó grandes resultados. El diseño de una metodología capaz de entregar una secuencia fue extremadamente importante y formó a muchos profesionales del área”, dijo el genetista Marcio de Castro, director científico de la FAPESP, en una entrevista (lea en Pesquisa FAPESP, edición nº 328).

La urgencia de la bioinformática
El procesamiento y la interpretación de la inmensa cantidad de datos generados exige la formación de profesionales altamente especializados: los bioinformáticos. Marcela Uliano-Silva es consciente de esta necesidad y acaba de desarrollar un programa de acceso abierto para ensamblar genomas mitocondriales, algo que aún no existía, según un artículo publicado en julio en la revista científica BMC Bioinformatics. Se trata de un tipo especial de ADN: es el resultado de una simbiosis antigua con bacterias, es circular y suele transmitirse de madres a hijos. Ella advierte que es imperioso que los biólogos aprendan programación porque hay una gran necesidad de desarrollo de software para analizar y visualizar los datos.

Steve Wilson / Wikimedia Commons | Ivar Leidus / Wikimedia Commons | Oceancetaceen / Wikimedia Commons | Andrew Mercer / Wikimedia Commons | H. Zell / Wikimedia Commons Un nono tití, una abeja, un bufeo, un murciélago, un marsupial y una esponja marina: la regulación del desarrollo genera algunas de las diferenciasSteve Wilson / Wikimedia Commons | Ivar Leidus / Wikimedia Commons | Oceancetaceen / Wikimedia Commons | Andrew Mercer / Wikimedia Commons | H. Zell / Wikimedia Commons 

Galante añade que este tipo de formación no suele estar incluida en las carreras de grado brasileñas. Para convertirse en bioinformático, advierte, a menudo es necesario retomar los estudios para aprender estadística y matemática, algo que la mayoría de los profesionales graduados en ciencias biológicas no están dispuestos a hacer. “Las exigencias del campo de la estadística y la computación para el análisis de los datos genómicos son cada vez más complejas”, dice. Mientras tanto, según él, hay una necesidad emergente y en aumento en la iniciativa privada, y los estudiantes formados en su laboratorio que dominan esta área concluyen el doctorado con empleo garantizado en laboratorios de análisis clínicos y oncología, o en empresas que apuntan al desarrollo de tecnologías computacionales. “En un lapso de cinco años se ha formado todo un ecosistema de estas industrias que están demandando bioinformáticos en todo Brasil”.

Los avances tecnológicos tienen sentido, y alcanzan su máximo potencial a través de planteos científicos sólidos. Pero esta es una relación bidireccional, subraya Carlos Menck. “Cuando buscamos una herramienta para resolver un problema, a veces aprendemos algo que modifica el interrogante científico”. Muchos investigadores de áreas vinculadas a la salud que pasan la mayor parte de su tiempo en el laboratorio haciendo investigación básica, como es su caso, tienen un objetivo claro: resolver los problemas de los pacientes. Mientras buscan soluciones para dificultades prácticas de diagnóstico o cómo hacer que un fármaco actúe en donde se necesita, por ejemplo, dilucidan modos de actividad molecular; y mientras estudian el funcionamiento del ADN, pueden toparse con soluciones aplicadas inesperadas.

Proyectos
1.
 CEGH-CEL – Centro de Estudios del Genoma Humano y Células Madre (nº 13/08028-1); Modalidad Centros de Investigación, Innovación y Difusión (Cepid); Investigadora responsable Mayana Zatz (USP); Inversión R$ 55.474.011,98.
2. El papel de los daños en el ADN y la función mitocondrial en el envejecimiento vascular, inmunitario y neurológico (DNA MoVINg) (nº 19/19435-3); Modalidad Proyecto Temático; Investigador responsable Carlos Frederico Martins Menck (USP); Inversión R$ 8.100.714,10.
3. El aporte de los genes, los genomas y los elementos de transposición en la interacción entre las plantas y los microorganismos. Un estudio de caso en la caña de azúcar (nº 16/17545-8); Modalidad Proyecto Temático; Programa Bioen; Investigador responsable Marie-Anne van Sluys (USP); Inversión R$ 6.106.313,34.
4. Retroelementos: una fuerza motriz que crea novedades genéticas en el genoma humano y en el de los ratones (nº 18/15579-8); Modalidad Joven Investigador; Investigador responsable Pedro Alexandre Favoretto Galante (SBSHSL); Inversión R$ 2.080.277,52.
5. Receptores olfativos. Mecanismos de expresión génica y transducción de señales (nº 16/24471-0); Modalidad Proyecto Temático; Investigadora responsable Bettina Malnic (USP); Inversión R$ 1.486.107,99.
6. El impacto de las proteínas de unión al ARN en la desregulación del splicing en glioblastomas (nº 17/19541-2); Modalidad Beca posdoctoral; Investigador responsable Pedro Alexandre Favoretto Galante (SBSHSL); Beneficiaria Gabriela Der Agopian Guardia; Inversión R$ 321.292,29.

Artículos científicos
MATTICK, J. y AMARAL, P. RNA – The epicenter of genetic information. Boca Ratón: CRC Press, 2023.
GUARDIA, G. D. A. et alAcute myeloid leukemia expresses a specific group of olfactory receptorsCancers. v. 15, n. 12, 3073. 6 jun. 2023.
WRIGHT, C. J. et alChromosome evolution in LepidopterabioRxiv. 14 may. 2023.
CORRADI, C. et al. Mutational signatures and increased retrotransposon insertions in xeroderma pigmentosum variant skin tumorsCarcinogenesis. bgad030. 17 may. 2023.
MERCURI, R. L. et al. Retro-miRs: Novel and functional miRNAs originated from mRNA retrotranspositionbioRxiv. 25 feb. 2023.
CONCEIÇÃO, I. M. C. A. da, et al. Metformin treatment modulates long non-coding RNA 2 isoforms expression in human cellsNon-coding RNA. v. 8, n. 5, 68. 12 oct. 2022.
MULHAIR, P. O. et al. Diversity, duplication, and genomic organization of homeobox genes in LepidopteraGenome Research. v. 33, p. 32-44. 2023.
ULIANO-SILVA, M. et alMitoHiFi: A python pipeline for mitochondrial genome assembly from PacBio High Fidelity readsBMC Bioinformatics. v. 24, 288. 18 jul. 2023.
DELLA COLETTA, R. et al. How the pan-genome is changing crop genomics and improvementGenome Biology. v. 22, n. 3. 4 ene. 2021.
FU, J. M. et al. Rare coding variation provides insight into the genetic architecture and phenotypic context of autismNature Genetics. v. 54, p. 1320-31. 18 ago. 2022.
COSTA, C. I. S. et alThree generation families: Analysis of de novo variants in autismEuropean Journal of Human Genetics. 6 jun. 2023.
HERNANDES-ROSA, J. et alEvidence-based gene expression modulation correlates with transposable element knock-downbioRxiv. 15 ago. 2020.

Republicar