Imprimir Republish

Buenas prácticas

Un software detecta errores en artículos sobre la genética del cáncer

Esta herramienta está disponible para la realización de test y verifica si las secuencias de nucleótidos descritas en papers son auténticas

Sandro Castelli

Ya se encuentra disponible una versión de prueba para realizar test por internet de un software ideado para detectar errores o fraudes en secuencias de ADN descritas en artículos científicos. El programa, denominado Seek & Blastn y desarrollado por la oncóloga australiana Jennifer Byrne junto al informático francés Cyril Labbé, compara secuencias de nucleótidos de genes humanos publicadas en papers con las que se encuentran archivadas en el banco de datos público Blastn (Nucleotide Basic Local Alignment Search Tool), de Estados Unidos. “El software busca incompatibilidades entre la descripción de una secuencia en el artículo y lo que la misma es, en realidad”, explicó Jennifer Byrne en una entrevista para la revista Nature. Según Cyril Labbé, la versión online todavía debe ser perfeccionada ya que presenta dificultades, por ejemplo, para reconocer secuencias de nucleótidos descritas en archivos PDF.

“No obstante, el software ya brinda una ayuda significativa para reducir los análisis manuales efectuados por expertos”, expresó Labbé, en el marco de un congreso internacional sobre revisión por pares que se llevó a cabo en el mes de septiembre en la ciudad de Chicago, en Estados Unidos. El Seek & Blastn puede consultarse en la dirección electrónica scigendetection.imag.fr/TPD52/.

El dúo de investigadores ya detectó errores en más de 60 trabajos sobre genética del cáncer. Algunos de ellos son mínimos y accidentales, pero en muchos casos las incongruencias son suficientes como para invalidar resultados y conclusiones. “Lo más grave es que el uso de datos erróneos puede tener implicaciones en la investigación clínica y en la búsqueda de tratamientos contra el cáncer”, dijo. “Los científicos deben comprender mejor la naturaleza de esos errores para ahorrarse tiempo y dinero en el intento de reproducir resultados incorrectos”.

El interés de la investigadora por el tema surgió en 2015, cuando se topó con ese problema en cinco artículos sobre genética del cáncer. Los papers describían un mismo tipo de experimento, en el cual se desactivaba un gen, el TPD52L2, utilizando como blanco una secuencia corta de nucleótidos, y relataban los efectos de dicha maniobra sobre el desarrollo de células tumorales. Byrne, quien se desempeña como jefa de la unidad de cáncer pediátrico en el Kids Research Institute y es docente de oncología molecular en la Universidad de Sídney, conocía muy bien a ese gen, que había sido identificado en 1988 por un grupo de científicos comandado por ella. Dicho gen, está relacionado con la aparición de ciertos tipos de cáncer de mama y de leucemia, pero todavía se conoce poco sobre su actividad.

Universidad de Sídney La oncóloga australiana Jennifer Byrne concibió un programa que detecta fallas en forma automáticaUniversidad de Sídney

La oncóloga inmediatamente se percató de que la secuencia de nucleótidos descrita en los cinco papers no se ajustaba a la realidad. “Era altamente improbable, por no decir imposible, que ellos hubiesen arribado a los resultados que se consignaban”, declaró la investigadora en el periódico Sydney Morning Herald. Ella les informó de su hallazgo y desconfianza a los editores de los periódicos que habían publicado los artículos, y cuatro de los cinco papers terminaron siendo retractados. Sus autores admitieron que no habían realizado el experimento, pero le habían comprado los datos a una empresa de biotecnología, aunque esa colaboración no había sido declarada.

La sospecha de Byrne acerca de que ese episodio no fuera un caso aislado la condujo a iniciar una búsqueda de otros papers en la base de datos PubMed, y se topó con problemas similares en otros 48 artículos. Todos ellos describían la desactivación de genes, pero había tantas coincidencias en títulos, datos e imágenes que la oncóloga barruntó que sus autores también habían obtenido los datos de segunda mano. Entonces firmó un acuerdo con Cyril Labbé, de la Universidad de Grenoble, en Francia, quien había ideado un software para identificar papers fraudulentos, que no tenían sentido, generados por computadora y publicados en las crónicas de conferencias, que normalmente son poco leídas. Mediante ese trabajo conjunto, detectaron errores en las secuencias de nucleótidos de 30 artículos, todos ellos escritos por investigadores chinos. Sin identificar a los autores, ambos describieron el problema en un artículo que fue publicado en 2016 en la revista Scientometrics.

Por el momento, el software Seek & Blastn sólo compara nucleótidos de genes humanos, pero los dos investigadores se proponen extender ese análisis a secuencias de animales de laboratorio. Ellos ofrecieron una versión preliminar de prueba en internet para que otros científicos evalúen el programa y ayuden a perfeccionarlo. La intención es, más adelante, ofrecérselo a los editores de periódicos, para que puedan utilizarlo en el análisis de manuscritos remitidos para su publicación.

Ya se encuentran disponibles diversas herramientas capaces de chequear en forma automática la solidez y veracidad de grandes volúmenes de datos de investigación. Las más conocidas y difundidas son las que rastrean textos en busca de evidencias de plagio. Pero hay otros ejemplos. Científicos de la Universidad de Tilburg, en Holanda, crearon un software capaz de detectar errores estadísticos y generaron controversia al analizar 50 mil artículos del campo de la psicología y divulgar los resultados en forma pública.

La Oficina de Integridad Científica (ORI, en inglés), que monitorea las investigaciones en el ámbito del Departamento de Salud de Estados Unidos, recomienda un conjunto de software que detectan manipulación o copia de imágenes. Para David Allison, experto en estadística de la Universidad de Indiana en Bloomington, tales herramientas son valiosas cuando se las usa para promover buenas prácticas o alentar a los investigadores en la prevención de errores. “También pueden ser de ayuda para medir índices de error en periódicos o en campos del conocimiento”, declaró Alisson a la revista Nature.

Republicar