Imprimir

Ciencia

Rellenando lagunas

Brasileños delinean una estrategia de investigación genómica y culminan la secuencia de 211 genes humanos

En febrero de 2001, cuando lo presentaron públicamente, se llegó a comparar el genoma humano con un paisaje de extensos desiertos entremediados por ciudades dispersas. Los desiertos representaban así a los largos tramos de ADN, técnicamente llamados intrones, que aparentemente no tenían función alguna -no activaban la producción de las proteínas que forman los seres vivos. Las ciudades serían los tramos funcionales del ADN, llamados exones. Con todo, había aún muchas zonas difusas y, en un primer momento, se hacía imposible saber qué era desierto y qué partes que correspondían a las ciudades, ni cuántas eran, ni donde estaban. Tamaña era la incertidumbre que las estimaciones del número de genes variaban entre 35 mil y 120 mil.

En medio a una carrera internacional en busca del número exacto y de la localización precisa, del tamaño y de la estructura de los genes, grupos de investigación de Estados Unidos, Japón y Alemania llenaron salas con decenas de secuenciadores de ADN, que funcionaban día y noche. Aunque no contaban con ese arsenal de equipos, los investigadores de universidades e institutos paulistas no se dejaron amilanar. Adoptaron una estrategia propia y ambiciosa -con un análisis exhaustivo de los datos públicos sobre el genoma, sumado a pruebas de laboratorios- y, cuatro años después, lograron completar la secuencia de 211 genes de los cuales antes solamente había fragmentos, al margen de demostrar donde se encuentran en el genoma -las ciudades adquirían así una localización exacta en medio al paisaje desértico.

Los casi cien investigadores de 31 laboratorios de universidades paulistas y del Instituto Ludwig de Investigaciones sobre el Cáncer también descubrieron alrededor de 40 nuevos genes que no habían sido descritos aún por ningún otro grupo. Los resultados de este trabajo, coordinado por Anamaria Camargo, del Ludwig, y por Mari Cleide Sogayar, del Instituto de Química de la Universidad de São Paulo (USP), fueron publicados online al final del mes pasado y salieron el día 1º de este mes en la versión impresa de la revista Genome Research.

“Esta ciencia es el resultado de una sociedad entre la FAPESP y el Instituto Ludwig”, comenta José Fernando Perez, director científico de la FAPESP. La Fundación y la filial paulista del Ludwig llevaron adelante durante dos años, entre 1999 y 2001, el Proyecto Genoma Humano del Cáncer, para el cual cada institución destinó el equivalente actualizado a 30 millones de reales.

Este trabajo conjunto culminó con un saldo de aproximadamente 1.200.000 secuencias de genes asociados a varios tipos de cáncer -eran secuencias de tramos centrales de los genes, caracterizados mediante el empleo de una metodología creada en el país: Orestes, sigla de Open Reading Expressed Sequence Tags, que en castellano significa algo así como etiquetas de la fase abierta de lectura de secuencias expresadas. Con un abordaje complementario, otros grupos de investigación habían secuenciado los extremos de tramos de genes con otra técnica: la llamada EST, de Expressed Sequence Tags o etiquetas de secuencias expresadas.

En el marco del Proyecto Transcriptoma del Cáncer, que se inició a finales de 2000, con inversiones equivalentes a alrededor de 4 millones de reales a cargo de la FAPESP y 1,5 millones de reales costeados por el Ludwig, los científicos procuraron unir ambos conjuntos de secuencias, las del medio y las de los extremos de los genes. Ambos estaban formados únicamente por exones, las partes activas de los genes, pero no siempre eran suficientes como para completar los genes; quedaban aún muchos espacios vacíos.

“En principio, cualquier grupo de investigación podría haber hecho ese trabajo, ya que todos los datos eran públicos”, afirma Sandro José de Souza, coordinador del equipo de bioinformática del Ludwig. “Pero nuestra ventaja radicó en el hecho de unir grupos con distintos intereses”. La aventura empezó oficialmente en 2001 y movilizó a cinco equipos de bioinformática -del Ludwig, de la Universidad de Ribeirão Preto (Unaerp), de la Universidad Federal de São Paulo (Unifesp), de la Facultad de Medicina de Ribeirão Preto y del Instituto del Corazón, estos dos últimos de la Universidad de São Paulo (USP).

Postulantes a genes
Los bioinformáticos, tal como se hacen llamar, superponían las secuencias del centro y de los extremos de los genes con las informaciones que llegaban desde los proyectos internacionales de secuenciamiento del genoma humano -eran largas listas de nucleótidos (las unidades de ADN), sin que nadie tuviera la menor idea acerca de dónde estaban los intrones y los exones. “Centramos nuestra atención en los genes incompletos, reuniendo las secuencias de Orestes y de otras ESTs”, comenta Souza. De allí salían listas de candidatos a genes, seleccionados con la ayuda de programas de computadora, que eran testeados experimentalmente por los equipos de 31 laboratorios del Instituto Ludwig, la USP, la Unifesp, la Universidad Estadual Paulista (Unesp), la Universidad de Campinas (Unicamp) y la Universidad Vale do Paraíba (Univap).

Los primeros resultados que daban cuenta de la viabilidad de la técnica salieron en octubre de 2001 en Proceedings of the National Academy of Sciences (PNAS) y, en un comentario de dos páginas, se hicieron merecedores del reconocimiento de parte de dos autoridades mundiales en el área de genoma humano: Robert Strausberg y Gregory Riggins, ambos del Instituto Nacional del Cáncer (NCI en inglés) de Estados Unidos.

El hecho de haber hallado el camino hizo que las cosas se tornasen al menos un poco más fáciles. Luciana Oliveira Cruz, investigadora del equipo de Mari Cleide, trabajó mucho durante meses, cultivando 20 linajes de tejidos humanos -de útero, testículos e hígado, entre otros-, preparando muestras de ADN complementario (cADN), que corresponde a los genes activos de cada tejido, y distribuyéndolas entre los laboratorios que llevaban adelante las pruebas con los 488 postulantes genes previamente seleccionados para ver si eran realmente tales. Cada gen era sometido a la reacción en cadena de polimerasa, una técnica conocida por sus iniciales PCR, con dos primers específicos. Los primers son secuencias de nucleótidos sintéticos, armadas en este caso con base en dos tramos conocidos de ADN (Orestes o ESTs) -éstos primers delimitan los extremos de un fragmento de ADN que será copiado miles de veces.

“Sabemos que ambos tramos antes descritos como secuencias individuales pertenecen a un solo gen, cuando con base en los primers se obtiene la copia del cADN, una demostración de que se trataba de pedazos de una sola molécula”, dice Luciana. A esta estrategia -de alineamiento de los tramos de ADN y prueba con primers- se la denominó Iniciativa de Finalización de Transcritos (TFI, de Transcript Finishing Initiative) y determinó qué parte correspondía a intrones y qué parte a exones en los genes incompletos. Con una eficiencia del 43%, reveló la existencia de 211 nuevos genes, muchos de éstos descritos por otros grupos de investigación mediante el empleo de otras técnicas en el transcurso del proyecto. Restaron alrededor de 40 inéditos, presentados en el artículo de Genome Research.

El Proyecto Transcriptoma terminó al final del año pasado, pese a que aún restan completar millares de lagunas en el genoma humano. Todavía no existe un consenso acerca de cuál es el número total de genes; sin embargo, ya se han descrito alrededor de 25 mil genes completos -o casi completos.

El Proyecto
Caracterización de Genes Humanos Completos – Una Extensión del Genoma Humano del Cáncer
Modalidad
Proyecto Especial
Coordinadoras
Anamaria Aranha Camargo – Instituto Ludwig de Investigaciones sobre el Cáncer, y Mari Cleide Sogayar – Instituto de Química de la USP
Inversión
R$ 540.000,00 y R$ 550.000,00