Para repartir y multiplicar el conocimiento : Revista Pesquisa Fapesp

La crisis del nuevo coronavirus está modificando el modo de comunicarse y el trabajo conjunto de los investigadores, aportando mayor celeridad y transparencia a la dinámica de la producción y la difusión del conocimiento. En este contexto de urgencia por desarrollar vacunas y medicamentos, muchos científicos están compartiendo en forma instantánea sus datos de investigación, todo ese volumen de informaciones primarias que les sirven de base para arribar a las conclusiones de sus estudios. Este comportamiento forma parte de una campaña que involucra a gobiernos, empresas, organismos internacionales, agencias de financiación y a la comunidad científica que, para hacer frente a la pandemia, comenzaron a promover las prácticas que se encuadran en la ciencia abierta, un concepto que implica el acceso libre a la información y el desarrollo conjunto del conocimiento. En el mes de mayo, por ejemplo, la Organización para la Cooperación y el Desarrollo Económico (OCDE) reafirmó mediante un comunicado la importancia de esta estrategia en la lucha contra el covid-19: “Ante emergencias globales como la pandemia del nuevo coronavirus, la implementación de políticas de ciencia abierta allana el camino para el flujo de datos e ideas de investigación, acelerando el ritmo de desarrollo del conocimiento para combatir la enfermedad”.

Así surgieron diversas iniciativas tendientes a estimular el intercambio de información científica sobre el nuevo coronavirus. Una de ellas es Nextstrain, un banco de análisis de las secuencias genéticas del Sars-CoV-2 creado por investigadores de la Universidad de Basilea, en Suiza, y del Centro de Investigaciones del Cáncer Fred Hutchinson, en Seattle, Estados Unidos. A través del mismo, pueden mapearse los esquemas de dispersión del virus cotejando la información sobre mutaciones en su material genético provenientes de fuentes múltiples. “Los científicos pueden compartir los datos de esos análisis, compararlos e identificar cómo y en qué lugares del mundo el nuevo coronavirus está mutando”, explicó Trevor Bedford, uno de los creadores de la plataforma. El proyecto ha revelado conexiones entre cepas que se hallaron en Australia con casos de covid-19 en Irán, además de un paciente en Taiwán infectado con una variedad proveniente de los Países Bajos. También constató que la cepa del Sars-CoV-2 que se propagó en Italia es la misma que llegó a América Latina y a África, mientras que en Asia se ha registrado el regreso de linajes que había exportado a Europa.

Plataforma Covid-19 Data Sharing/BR reúne los datos de laboratorio y demográficos de casi 180 mil personas

A juicio de Bedford, esta plataforma podría haber sido útil en epidemias tales como la de zika, entre abril de 2015 y noviembre de 2016. “En aquella ocasión, la zona más afectada fue el nordeste de Brasil. Si hubiésemos dispuesto de una herramienta capaz de mapear en tiempo real cómo y con qué velocidad se propagaba por el mundo el virus del Zika, tal vez habríamos podido prever que aquella región sería la más vulnerable. Eso nos daría la posibilidad de limitar la propagación de la enfermedad”.

La urgencia por contar con datos sobre el nuevo coronavirus llevó a la Comisión Europea a lanzar en el mes de abril, asociada con otros colaboradores, Covid-19 Data Portal. Esta plataforma permite que los investigadores compartan, accedan y analicen diversos tipos de datos sobre el nuevo coronavirus, tales como las proteínas y genes específicos de ese agente patológico. Esta información está ayudando en el desarrollo de sistemas de inteligencia artificial capaces de identificar las principales áreas de concentración de los estudios sobre el covid-19 en el mundo, con el objetivo de señalar esfuerzos superpuestos y abordajes prometedores que merecen estudiarse. El portal también recopila información guardada en otros repositorios de la región, como el británico Elixir, que aglutina resultados de investigaciones en el área de las ciencias de la vida pero recientemente creó una sección exclusiva para el Sars-CoV-2, incluyendo información referida a los genes específicos del virus, los linajes celulares más adecuados para el estudio de sus mecanismos de acción y las proteínas que interactúan con el patógeno.

Nextstrain ofrece acceso a 1.787 análisis genómicos de las cepas de Sars-Cov-2 circulantes en América del Sur

Este esfuerzo de intercambio también ha tenido eco en Brasil. Un ejemplo de ello es la plataforma Covid-19 Data Sharing/BR, que fue lanzada en junio. Se trata de un repositorio que es fruto de una articulación de la FAPESP que involucró a la Universidad de São Paulo (USP), el grupo Fleury de laboratorios y los hospitales Albert Einstein y Sírio-Libanês, recopila datos de laboratorio y demográficos de alrededor de 180 mil individuos sometidos a test para el diagnóstico de covid-19 –que registraron resultados positivos o negativos–, además del desenlace de 6.500 casos –tales como recuperación o defunción– y casi 5 millones de resultados de análisis clínicos y de laboratorio. “Se espera que esa información pueda utilizarse para mejorar el diagnóstico, en estudios acerca de los factores relacionados con la evolución de la enfermedad en Brasil y en investigaciones sobre posibles medicamentos y vacunas”, dijo el neurocientífico Luiz Eugênio Mello, director científico de la FAPESP, al lanzarse la iniciativa.

El nuevo repositorio utiliza una estructura computarizada creada por la Superintendencia de Tecnología Informática de la USP, que desde diciembre de 2019 se utiliza para conectar los repositorios de datos de investigaciones de diferentes instituciones paulistas (lea en Pesquisa FAPESP, edición nº 287). “El hecho de disponer de esta estructura nos sirvió para acelerar la implementación de la plataforma para el covid-19”, remarcó el físico Sylvio Canuto, prorrector de Investigación de la USP.

Más de 2.800 ensayos clínicos de tratamientos para el covid-19 están disponibles en el Cochrane Covid-19 Study Register

El estímulo al intercambio de datos es antiguo y responde a varios motivos. Uno de ellos es la preocupación por la reproducibilidad de las investigaciones y la importancia de disponer de la información primaria recopilada para que otros científicos puedan comprobar la exactitud y la trascendencia de los resultados divulgados. Con la pandemia, esto ha adquirido un significado más urgente. “El intercambio puede optimizar los esfuerzos de investigación y propiciar nuevas colaboraciones, agilizando el ritmo de los avances”, explica la ingeniera electricista Claudia Bauzer Medeiros, del Instituto de Computación de la Universidad de Campinas (Unicamp) y miembro de la coordinación de los programas eScience y Data Science de la FAPESP. “También permite que los investigadores lleven a cabo estudios combinando datos de orígenes diversos”.

Bauzer Medeiros trabaja como asesora de la Research Data Alliance, una organización creada en 2013 para difundir el intercambio de datos científicos y generar infraestructuras que hagan posible esa tarea. En marzo, ella y otros 136 miembros afiliados aunaron esfuerzos para la elaboración de recomendaciones para acelerar la investigación sobre el covid-19 (véase el recuadro).

“La pandemia puso en evidencia la importancia de fomentar el intercambio de resultados científicos de manera rápida y abierta”, le dijo a Pesquisa FAPESP el bioquímico británico Richard Sever, uno de los creadores de bioRxiv, un repositorio de preprints que recopila artículos de ciencias biológicas. “Esta práctica ha contribuido para el avance del conocimiento sobre el virus”. La comparación con otras situaciones del pasado ayuda a demostrar la importancia del esfuerzo actual. “La secuenciación completa del genoma del Sars-CoV-1, que generó un brote en Asia entre 2002 y 2003, tardó casi cinco meses para completarse”, dice el ingeniero eléctrico Daniel Villela, investigador del Programa de Computación Científica de la Fundación Oswaldo Cruz (Fiocruz). “Ahora, el flujo de informaciones sobre el covid-19 pocos días después de haberse tomado las primeras muestras de los individuos afectados permitió la secuenciación completa del genoma del Sars-CoV-2 en tan solo un mes”.

A pesar de los avances en el marco de la pandemia, algunos obstáculos subsisten. La consolidación de un ámbito propicio para el flujo de la información supone no solo la predisposición de los investigadores a compartir sus datos, sino también un compromiso de los gobiernos para recopilar y proveer información de manera transparente. A partir de abril, Open Knowledge Brasil, una organización que promueve la transparencia de la información pública, analiza la disponibilidad y la calidad de los datos epidemiológicos y de infraestructura sanitaria relacionados con el covid-19 que proveen el gobierno federal y los gobiernos estaduales y municipales. El Índice de Transparencia del covid-19 en los estados y en la Unión se actualiza cada 15 días y toma en cuenta tres aspectos para evaluar la información divulgada: contenido, formato y granularidad, es decir, el grado de detalle de los datos divulgados. “Verificamos que tan solo cinco estados divulgan bases de datos minuciosas, incluyendo notificaciones de casos sospechosos, por ejemplo”, explica Fernanda Campagnucci, directora ejecutiva de Open Knowledge Brasil. “En cuanto al gobierno federal, se nota una falta de articulación en la difusión de información detallada sobre la pandemia, esencial para calcular la dinámica de propagación del virus”.

A pesar de los esfuerzos globales, muchos investigadores todavía se resisten a incorporar la práctica colaborativa en su rutina de trabajo. A algunos les preocupa un uso incorrecto de las informaciones originales. Otros evitan dar a conocer sus datos porque quieren utilizarlos en nuevos estudios o temen no recibir el debido crédito por su cesión. Por eso hay preocupación porque el intercambio mengue después de la pandemia.

A partir de octubre de 2017, la FAPESP, siguiendo el ejemplo de las agencias de financiación de Australia, Estados Unidos y Europa, exige que las solicitudes de financiación de proyectos incluyan un plan de gestión de datos, desde su recolección hasta dónde quedarán disponibles. “La estrategia del intercambio de datos se convertirá progresivamente en un elemento cada vez más importante en el análisis de los proyectos presentados ante la FAPESP”, dice Luiz Eugênio Mello, el director científico de la Fundación.

Para la científica de datos brasileña Renata Curty, que se desempeña en la gestión y preservación de datos de investigación en la Universidad de California en Santa Bárbara (EE. UU.), las agencias de fomento pueden ayudar a establecer nuevos comportamientos en lo atinente al intercambio de datos. “Sin embargo”, dice Curty, “también es necesario invertir en parámetros de evaluación de estos planes y en sistemas que verifiquen si los datos realmente fueron compartidos y analicen la calidad de ese material”. Una de las preocupaciones consiste en garantizar que esa información venga acompañada de lo que se denominan metadatos, que ofrecen una descripción minuciosa de los datos generados en un estudio determinado, especificando cómo se produjeron, quién los generó, cuándo, dónde y cómo se los puede reutilizar, para hacer posible su debida interpretación y ampliar el potencial de reaprovechamiento en nuevas investigaciones.

A juicio de Claudia Bauzer Medeiros, para que la cultura del intercambio se consolide después de la pandemia es necesario avanzar en la implementación de mecanismos de compensación para los que adoptan esta práctica. Una de las estrategias sería la creación de indicadores de citas de las informaciones compartidas. “De la misma manera, es importante que esas métricas sean tenidas en cuenta por los sistemas de evaluación, como una manera de reconocer y valorar el esfuerzo realizado por los investigadores que proporcionan sus datos”. Un entorno con acceso libre a la información y la construcción conjunta del conocimiento también depende de una financiación sistemática. “Entre el 20% y el 30% de las iniciativas que incluyen el intercambio de datos primarios se interrumpe luego de dos o tres años por falta de recursos”, enfatiza.

Una guía para el intercambio de datos

La organización Research Data Alliance (RDA) divulgó hacia finales del mes de junio un documento con directrices detalladas para promover el intercambio y la reutilización de datos en el marco de la pandemia y en contextos eventuales de emergencia. Las mimas abordan el uso de los resultados de estudios clínicos, epidemiológicos, sociológicos y ómicos, siendo este último un neologismo que engloba a las investigaciones en las áreas de la genómica, transcriptómica, proteómica y metabolómica, así como el desarrollo de estrategias que faciliten el intercambio de informaciones.

El informe es fruto de un trabajo conjunto que involucra a científicos de varios países, entre ellos Claudia Bauzer Medeiros, del Instituto de Computación de la Unicamp. “A mediados de marzo y a pedido de la Comisión Europea, la RDA convocó a sus más de 10 mil afiliados para elaborar orientaciones que pudieran colaborar con las diversas estrategias de intercambio”, relata Bauzer Medeiros. Ciento treinta de ellos se abocaron a ese proyecto, dividiéndose en grupos de redacción. “Nos reuníamos dos o tres veces por semana en forma virtual, para debatir y redactar en forma conjunta el documento final”.

El informe propone que los gobiernos, las agencias de fomento de la investigación e instituciones científicas de todo el mundo trabajen en forma mancomunada para el desarrollo de políticas y promover inversiones tendientes a optimizar el flujo de datos entre entidades locales e internacionales. “El documento hace hincapié en la necesidad de que los datos, software y modelos compartidos sean ubicables, accesibles, interactivos y reutilizables”, explica Bauzer Medeiros. “Eso exige de los investigadores un plan de gestión detallado, incluyendo información sobre el modo en que se generaron los datos y cómo se los puede reutilizar”.

Republicar

Republish