Imprimir Republish

Bioinformática

Simplicidad natural

Un nuevo método de comparación de genomas puede ayudar a construir el árbol de la vida

EDUARDO CESAR, JOÃO ALEXANDRE E MIGUEL BOYAYANCon los equipamientos modernos, cada vez resulta más fácil y rápido leer el ADN completo de cualquier ser vivo. Sin embargo, esta evolución de la tecnología todavía no simplifica la comparación de genomas cuando se trata de evaluar similitudes entre especies y erigir un árbol de la vida. Con los métodos actuales, las computadoras tardan demasiado para comparar el material genético completo de un conjunto de más de veinte especies, evalúa el matemático João Meidanis, del Instituto de Informática de la Universidad Estadual de Campinas (Unicamp). No satisfecho con la solución habitual de buscar aproximaciones para que tengan sentido los datos, desarrolló junto a su alumno Pedro Feijão un nuevo método para comparar genomas, que en septiembre pasará por una prueba de fuego: será presentado ante colegas de todo el mundo en el workshop Algoritmos en Bioinformática, que se desarrollará en Estados Unidos.

Lo que lentifica el análisis de los datos ya no es obtener las secuencias, sino compararlas. Esto sucede porque cada genoma se encuentra representado por miles de millones de letras en hilera (alrededor de tres mil millones, en el caso humano). Los métodos de comparación entre especies utilizan representaciones matemáticas de los modelos de cómo las mutaciones naturales en poco tiempo sustituyen letras o rompen esa larga cadena que vuelve a unirse en otro punto una contabilidad extenuante hasta para las computadoras más potentes.

La fórmula propuesta por el dúo de matemáticos simula una situación en la que el genoma sería roto en un sólo punto y luego arreglado nuevamente en modo aleatorio. Si eso sucede sucesivas veces, la secuencia genética se va mezclando. De ahí proviene el nombre single cut or join (único corte o juntura) que lleva el método. El proceso simula el tipo más común de reconfiguración genética, en donde un tramo del ADN queda invertido. Si la coma de la frase anterior fuese el punto de ruptura, la frase podría convertirse en aciténeg nóicarugifnocer ed númoc sám opit le alumis osecorp lE, donde un tramo del ADN queda invertido o en que un tramo del ADN queda invertido, y el proceso simula el tipo más común de reconfiguración genética, entre otras posibilidades. Esa es una de las formas de alteración más comunes en el genoma, explica Meidanis, ya que preserva segmentos intactos manteniendo las propiedades genéticas. El programa que él desarrolló realiza una serie de cortes aleatorios en el genoma seleccionado y determina la similitud con otro genoma por el número de cortes necesarios para que el primero quede igual que el segundo. Al comparar el material genético de varias especies mediante ese método es posible comparar hasta 100 genomas en pocos días- el programa de Meidanis y Feijão produce una matriz filogenética que revela el parentesco entre los seres vivos comparados.

Debate
La recepción del trabajo estuvo lejos de ser unánime en la comisión científica que analizó los trabajos evaluados. Dos revisores consideraron que no estábamos presentando nada útil y tres quedaron en duda, comenta Meidanis. En lugar de ser motivo de desazón, la respuesta configuró un estímulo. Por empezar, porque el artículo fue analizado por cinco revisores en lugar de los tres habituales. Por lo visto, ellos tuvieron dificultades para decidir, aunque aún así, posiblemente aceptaron el trabajo porque es algo nuevo que puede originar un debate importante, sostiene.

EDUARDO CESAR, JOÃO ALEXANDRE E MIGUEL BOYAYANEllos están preparados para la discusión. Ya realizaron todos los cálculos para demostrar que su propuesta es, con seguridad, matemáticamente distinta de los métodos en uso: el punto de quiebre (breakpoint), utilizado desde comienzos del siglo XX cuando surgió la genética de las poblaciones, y el doble cut or join (doble corte o ligadura), más utilizado en los últimos tiempos. El método más antiguo es conceptualmente muy similar al propuesto ahora, pero difiere en la formulación matemática; el más reciente considera que el genoma se rompe en tres partes que se vuelven a unir aleatoriamente una complejidad innecesaria, según el parecer de Meidanis. Para él, la simplicidad de su modelo hace más sencilla la resolución de los problemas. Y tal vez acerque su solución mucho más a la realidad, agrega, citando al físico Albert Einstein: Dijo que todo debería ser considerado de la manera más simple posible, pero no más simple que eso.

En un próximo paso, las discusiones y colaboraciones con genetistas resultarán esenciales para evaluar si la simplificación matemática excede a la de la naturaleza. Por el momento, Meidanis y feijão han testeado el modelo con conjuntos de datos que la comunidad de bioinformáticos utilizan justamente para probar modelos novedosos. Al comparar el formato de los árboles obtenidos por el programa, ellos constatan que su método arriba a soluciones similares a las que otros encuentran, pero en un tiempo de procesamiento mucho más corto.

Aún antes de la discusión de este mes y de la publicación formal del trabajo, un grupo de investigación alemán ya demostró interés en recibir la versión final. Otra señal, para el profesor de la Unicamp, de que su propuesta es innovadora.

Artículo científico
FEIJÃO, P. e MEIDANIS, J. SCJ: a variant of breakpoint distance for which sorting, genome median and genome halving problems are easy. 9th Workshop on Algorithms in Bioinformatics. 2009.

Republicar