Imprimir Republish

CIENCIA DE DATOS

Las máquinas que hacen de la biología una ciencia de grandes números

Secuenciadores de ADN, grabadores, drones y otros artefactos de utilización en aumento permiten concretar inmensas mejoras de tiempo e imponen toda una transformación metodológica

Imagen de un fragmento de Bosque Atlántico del Parque Estadual Morro do Diabo, en Pontal do Paranapanema (São Paulo), obtenida mediante la técnica conocida como Lidar. Cada punto representa una parte de la vegetación (hojas o ramas) alcanzada por el haz láser. Los colores representan diferentes alturas de la vegetación, y los puntos azules más bajos, el suelo de la selva

Alexandre Uezu/IPÊ

El aire que nos rodea no es un espacio inerte, compuesto solamente de oxígeno y nitrógeno, vapor de agua, polvo y contaminación. Es un espacio vivo, en el cual continuamente nacen, se reproducen y mueren millones de microorganismos. En 2019, se analizaron muestras de aire recogidas en Singapur y en la Amazonia brasileña que revelaron que, durante el día, predominan las bacterias, y a la noche, los hongos, con escasas variaciones a lo largo del año. Ahora, nuevos análisis realizados en esa ciudad-estado asiática permitieron constatar que esa división se mantiene hasta los mil metros (m) de altura. Por encima de este límite reinan las bacterias adaptadas a los altos niveles de radiación solar, que son más raras en los estratos inferiores.

Este estudio pone de manifiesto que la investigación de campo en el área de la biología se basa cada vez más en enormes volúmenes de datos. El grupo de Singapur, coordinado por el químico alemán Stephan Schuster, de la Universidad Tecnológica de Nanyang (NTU), trabajó con 795 muestras de aire recogidas a distintas altitudes, en las cuales identificó unas 10.000 especies de microorganismos y, lo que es más asombroso, procesó 2,2 terabytes de datos, lo que equivale a 2 millones de megabytes.

Los biólogos que se dedican a la investigación de campo están experimentando las mismas transformaciones que vivieron los genetistas hace 20 años, cuando la cantidad de genomas secuenciados crecía exponencialmente e imponía nuevos métodos de trabajo. A lo largo de los últimos 15 años, los genetistas y los ecólogos han comenzado a utilizar secuenciadores de ADN más poderosos, capaces de descifrar varios genomas simultáneamente, lo que ha permitido realizar estudios minuciosos de los organismos que viven en el suelo, en el aire, en el agua e incluso dentro de otros seres.

Actualmente, no son solo los secuenciadores, sino también otros dispositivos los que han comenzado a utilizarse cada vez más asiduamente en los últimos cinco años, como los grabadores adaptados para el trabajo de campo y los drones, que almacenan y procesan cantidades de información que antes eran inconcebibles y permiten ahorrar tiempo en las expediciones a los bosques, las praderas y las sabanas. La tarea de los investigadores de campo se ha visto facilitada, pero, por otro lado, estos nuevos dispositivos exigen un conocimiento más profundo en disciplinas tales como matemática, estadística y programación, a la vez que se ha impuesto el trabajo conjunto con expertos de otras áreas.

“El análisis del microbioma del aire solo ha sido posible mediante un trabajo coordinado entre biólogos, climatólogos, programadores y los ingenieros que adaptaron el instrumental del avión de investigación para poder recabar los datos para este estudio”, comenta la bióloga Ana Carolina Martins Junqueira, quien trabaja desde 2017 en la Universidad Federal de Río de Janeiro (UFRJ) y participó del estudio que se llevó a cabo en Singapur.

A principios de la década de 2000, mientras cursaba sus estudios de maestría y doctorado en la Universidad de Campinas (Unicamp), Martins Junqueira secuenciaba el ADN mitocondrial de los moscardones de a un genoma por vez solamente.

En 2011, cuando viajó a Estados Unidos para realizar una pasantía posdoctoral en la Universidad del Estado de Pensilvania, se encontró con máquinas más potentes, los secuenciadores de nueva generación, con los que pudo secuenciar, de una sola vez, todos los genomas de los organismos que vivían en las vísceras de dos especies de moscas: Chrysomia megacephala y Musca domestica, capturadas en Brasil y en Estados Unidos. Los análisis registraron 431 especies de bacterias, entre ellas Helicobacter pylori, causante de úlceras y cáncer de estómago, tal como lo describe en un artículo publicado en noviembre de 2017 en la revista Scientific Reports.

En 2014, Junqueira acompañó a Schuster, su supervisor en Estados Unidos, y se trasladó al Centre for Environmental Life Sciences Engineering (Scelse) de la NTU, en Singapur, para participar en la búsqueda intensiva de las comunidades de microorganismos. Los resultados iniciales caracterizaron un ciclo diario de los microorganismos que viven en las capas del aire cercanas al suelo.

Un estudio complementario realizado con otros parámetros de comparación –muestras recogidas cerca del suelo, desde una torre meteorológica y desde un avión de investigación volando a 3.500 m de altura– apuntó que el ciclo diario se quiebra a los 1.000 m de altitud, aproximadamente, y que existe una estratificación: más cerca del suelo hay más hongos, a altitudes intermedias proliferan las bacterias y, por encima de ese límite, la diversidad de los microorganismos es menor y abundan las bacterias tolerantes a la radiación.

Simultáneamente, en agosto de 2018 y en marzo de 2019, investigadores de los estados brasileños de Paraná y Amazonas, recogieron muestras de aire a 2 m y a 26 m de altura, en el Observatorio de Torre Alta de la Amazonia (Atto), en una zona selvática a 150 kilómetros (km) de Manaos (estado de Amazonas). “Era poco lo que se sabía acerca de los tipos de microorganismos circulantes en el aire de las selvas brasileñas”, comenta el biólogo y coordinador del grupo, Luciano Huergo, del campus de Matinhos de la Universidad Federal de Paraná (UFPR). Las bacterias de los géneros Beijerinckiaceae y Azospirillum se revelaron abundantes y despertaron interés porque eran capaces de transformar el nitrógeno atmosférico (N2) en amonio (NH4), que las plantas pueden absorber. Por esta razón, podrían funcionar como un fertilizante natural.

Scelse/NTUEl avión de investigación utilizado para recoger muestras del aire de SingapurScelse/NTU

En 2009, el biólogo Marconi Campos-Cerqueira se mostró desorientado frente a tanta información, cuando desarrollaba su maestría integrada al Proyecto Dinámica Biológica de Fragmentos Forestales (PDBFF), con sede en el Instituto Nacional de Investigaciones de la Amazonia (Inpa), en Manaos. Tenía que identificar a las aves de la jungla oyendo su canto solamente, sin poder avistarlas. Los grabadores le facilitaron la tarea, pero enseguida apareció otro problema: eran tantas las horas grabadas que no acababa de oírlo todo, por lo que se aprovechaba muy poco.

Tuvo la suerte de conocer entonces al biólogo estadounidense Mitchell Aide, quien estaba desarrollando un programa de computación para identificar especies de aves a partir de su canto y lo invitó a trabajar con él en la Universidad de Puerto Rico. Cerqueira se mudó allí, realizó su doctorado con Aide y colaboró en el desarrollo del programa llamado Arbimon, las siglas en inglés de Automated Remote Biodiversity Monitoring Network, que separa e identifica los sonidos de cada especie. La última versión, descrita en septiembre de 2020 en la revista Ecological Informatics, logró una precisión del 89 % en la identificación automática de 24 especies de aves y sapos de Puerto Rico.

“El monitoreo acústico puede utilizarse combinado con otros métodos, porque todavía es necesario salir a hacer trabajo de campo para conocer el ambiente, los hábitos y la dieta de cada especie”, comenta Cerqueira, quien desde 2017 es el director científico de la organización no gubernamental Rainforest Connection. Esta plataforma informática, de acceso gratuito para los investigadores, alberga 2.163 proyectos de investigación, 57 millones de grabaciones, 29.000 análisis y 2.000 sonidos de especies de aves, anfibios y otros animales terrestres y marinos de América del Sur, Asia, África y Europa.

Colaborador de Cerqueira y usuario del Arbimon, el biólogo Alexandre Camargo Martensen, del campus avanzado de Buri de la Universidad Federal de São Carlos (UFSCar), estudia 120 áreas del Bosque Atlántico cercanas. Su equipo reunió alrededor de 1 millón de minutos de grabaciones de sonidos de aves, anfibios y mamíferos.

A partir de estas grabaciones y de las conversaciones mantenidas con los habitantes de la zona, el equipo de la UFSCar halló 15 ejemplares de una especie de rana arborícola anaranjada y verde limón, Phrynomedusa appendiculata, que no habían sido vistas desde 1970, en una zona de Bosque Atlántico en Capão Bonito, en el interior del estado de São Paulo, como relata en un artículo publicado en enero de este año en la revista Zootaxa.

Al igual que Martensen, el biólogo Alexandre Uezu, del Instituto de Investigaciones Ecológicas (IPÊ), en Nazaré Paulista (São Paulo), dedicaba la mayor parte de su tiempo al trabajo de campo durante su maestría y su doctorado, pero ahora pasa gran parte de sus días sentado frente a una computadora, organizando, buscando y analizando sonidos e imágenes. Realiza un seguimiento de los cambios en una zona de Bosque Atlántico en el Parque Estadual de Cantareira, en el Gran São Paulo, de otra en Pontal do Paranapanema, al oeste del estado, con financiación de la filial brasileña de la empresa China Three Gorges Corporation (CTG Brasil), y una tercera  en Alto Paranapanema, en el sur del estado.

Los grabadores instalados en 500 puntos de muestreo llevan registrados alrededor de 1,5 millones de minutos. Obtiene las imágenes vía satélite y, más recientemente, por medio de una técnica llamada Lidar (detección de luz y medición de distancia) que registra la variación de la luz reflejada por la vegetación, y los equipos del PDBFF la utilizan desde 2013 para realizar investigaciones en la selva amazónica (lea en Pesquisa FAPESP, edición nº 205). En este caso, los haces láser determinan la altura de los árboles y, cuando es posible, también llegan hasta el suelo para describir el relieve.

Para evaluar el crecimiento esperado de un bosque restaurado en un área que vincula una unidad de conservación estadual y otra federal, Uezu y su equipo recurrieron a la información registrada por el Lidar en sobrevuelos tripulados efectuados en 2015, 2016 y 2017. De este modo, han podido identificar un crecimiento del 35 % de la biomasa del bosque entre las dos reservas.

Con zum y sin estrés
El biólogo Fabiano Rodrigues de Melo, de la Universidad Federal de Viçosa, escuchó hablar por primera vez de los drones en 2014, cuando supo que los utilizaban para encontrar koalas en los bosques de Australia. En 2017, en el marco de un proyecto de investigación patrocinado por la fundación Grupo Boticário, le encargó su primer dron a una empresa de Río de Janeiro, que también desarrolló el software para realizar el recuento de los muriquíes del norte (Brachyteles hypoxanthus), evitando así tener que ver horas de filmaciones.

Su dron actual, adquirido gracias a la ayuda de la Wildlife Conservation Society, cabe en una mochila. Como posee zum, puede filmar a los animales desde una distancia de 30 m sin asustarlos. También se hizo más sencillo identificarlos mediante las diferencias en su pigmentación facial. “Antes tenía que acercarme a 15 m y los muriquíes huían, acaso creyendo que podía ser un predador”, relata. “En los bosques espesos, solo puedo avistar a los animales desde lo alto de los árboles, pero en las selvas secundarias he podido divisar monos titíes, que viven en estratos arbóreos más bajos, o incluso, en el suelo, venados, carpinchos, tayras, coatíes, osos hormigueros y decenas de especies de aves”.

Cambios en la metodología de trabajo
Los dispositivos para identificar animales y plantas por medio de los sonidos, imágenes o el ADN les simplifican la vida a los investigadores y facilitan la elaboración de los estudios de impacto ambiental, que los organismos gubernamentales exigen para la habilitación de obras o proyectos de secuestro de carbono. No obstante, para que los mismos sean eficaces, la información que generan debe gestionarse cuidadosamente. “La avalancha de datos disponibles impone cambios en la forma de analizar y almacenar la información”, subraya el biólogo Alexandre Camargo Martensen, de la UFSCar.

Según él, los datos recabados y el plan de investigación precisan tener un código de identificación, que se denomina script, que reconocerá las sucesivas versiones que se depositen en las bases de datos pertinentes, mientras se lleva a cabo la investigación. “Nosotros mismos elaboramos los programas de análisis, en lenguajes de programación R o Python”, dice.

Alexandre Uezu, del IPÊ, añade: “Como ahora la información se obtiene con mayor facilidad, debemos prestarle más atención al almacenamiento y al análisis”. En su opinión, es mejor como resultado un falso negativo –es decir, no identificar una especie que podría identificarse– que un falso positivo, o sea, un resultado erróneo. “No se puede habilitar el frenesí por recolectar datos si antes no se ha definido cabalmente el objetivo del trabajo”, recomienda Marconi Campos-Cerqueira. “Es importante definir las hipótesis que orienten el trabajo antes de comenzar a recabar información”.

Proyectos
1. La gobernanza de la transición forestal en el Bosque Atlántico. Para aumentar nuestro conocimiento sobre la recuperación forestal y los servicios ecosistémicos (nº 18/20501-8); Modalidad Programa Biota; Investigador responsable Alexandre Camargo Martensen (UFSCar); Inversión R$ 388.961,59
2. La resiliencia de los ecosistemas multifuncionales ante los cambios climáticos (nº 19/19429-3); Modalidad Programa Biota; Investigador responsable Alexandre Uezu (IPÊ); Inversión R$ 121.162,26

Artículos científicos
CLARE, E. L. et al. Measuring biodiversity from DNA in the airCurrent Biology. v. 32, n. 3, p. 693-700. 7 feb. 2022.
COSTA, D. P. da. et al. Forest-to-pasture conversion modifies the soil bacterial community in Brazilian dry forest CaatingaScience of Total Environment. v. 41, 151943. 1° mar. 2022.
DRAUTZ-MOSES, D. I. et al. Vertical stratification of the air microbiome in the lower tropospherePNAS. v. 119, p. e2117293119. 15 feb. 2022.
GUSAREVA, E. S. et al. Microbial communities in the tropical air ecosystem follow a precise diel cyclePNAS. v. 116, n. 46, p. 23299-308. 12 nov. 2019.
JUNQUEIRA, A. C. M. et alThe microbiomes of blowflies and houseflies as bacterial transmission reservoirsScientific Reports. v. 7, n. 1, 16324. 24 nov. 2017.
LEBIEN, J. et alA pipeline for identification of bird and frog species in tropical soundscape recordings using a convolutional neural networkEcological Informatics. v. 59, 101113. sept. 2020.
LYNGGAARD, C. et al. Airborne environmental DNA for terrestrial vertebrate community monitoringCurrent Biology. v. 32, n. 3, p. 701-7. 7 feb. 2022.
MORAES, L. J. C. L. et al. Rediscovery of the rare Phrynomedusa appendiculata (Lutz, 1925) (Anura: Phyllomedusidae) from the Atlantic Forest of southeastern BrazilZootaxa. v. 5087, p. 522-40, 2022.
NASCIMENTO, L. A. do et al. Acoustic metrics predict habitat type and vegetation structure in the Amazon. Ecological Indicators. v. 117, 106679. oct. 2020.
SOUZA, F. C. S. et al. Influence of seasonality on the aerosol microbiome of the Amazon rainforestScience of The Total Environment. v. 760. 15 mar. 2021.

Republicar