Imprimir Republish

BUENAS PRÁCTICAS

Encuentros a ciegas

Una nueva metodología rastrea colaboraciones científicas fuera de las normas para detectar artículos comercializados por fábricas de papers

FPG / Hulton Archive / Getty Images

En el marco de un estudio publicado en la revista Scientific Reports, se dio a conocer un método destinado a identificar trabajos producidos por fábricas de papers, servicios fraudulentos que venden manuscritos científicos, a menudo generados por programas de inteligencia artificial y basados en datos fabricados, y los remiten a distintos periódicos científicos en nombre de sus clientes. En lugar de buscar pistas de plagio o imágenes manipuladas, que son los rasgos más comunes de los artículos falsificados, este modelo se orienta fundamentalmente a detectar las características de la lista de autores, cuya combinación atípica puede indicar un origen espurio.

La premisa principal indica que, como los investigadores pagan para que sus nombres aparezcan incluidos en los estudios falsificados, esto termina por generar colaboraciones improbables y de un estándar sumamente distinto al de las que se establan en el mundo real, tales como las que unen a jóvenes investigadores y sus exdirectores de tesis y supervisores, o las ramificaciones de colaboraciones consagradas. El nuevo abordaje rastrea una serie de atributos poco comunes o sospechosos de los autores: si son muy jóvenes y al mismo tiempo son altamente productivos (más de 20 trabajos publicados en un año), si no están conectados con investigadores séniores y tienden a colaborar con otros investigadores jóvenes, y si participan en redes que se forman aleatoriamente y que rápidamente se deshacen. También suele suceder que los artículos fabricados tengan una lista de firmas mayor que la media de los de su área disciplinaria, pues los réditos de los servicios tramposos crecen a medida que logran venderle un mismo paper a múltiples clientes.

Las huellas digitales complementarias de los fraudes pueden aparecer en las referencias bibliográficas (existe una tendencia en los artículos falsos, al tener contenidos de baja calidad o repetitivos, a citar otras falsificaciones en lugar de echar mano de la literatura consagrada) y en el perfil de las revistas elegidas para publicar (les resulta más difícil engañar o cooptar a los periódicos científicos con un cuerpo de revisores calificado o que ejecutan la revisión por pares abierta, en la cual el análisis de los evaluadores es público).

Los resultados que el modelo obtuvo al analizar trabajos indexados en la base de datos Dimensions se compararon con los de otras formas de rastrear la actividad de fábricas de papers. Investigadores de perfil sospechoso detectados mediante la aplicación de este nuevo método aparecían en un 7,43 % de los 1.858 artículos listados entre 2020 y 2022 en el banco de datos de Retraction Watch, un sitio web que recopila publicaciones que fueron objeto de retractaciones, es decir, que se las invalidó por diversos motivos, y el haberse originado en una fábrica de papers es uno de ellos.

Se constató también que estudios vinculados con las redes de autores sospechosas estaban relacionados con el 37 % de los artículos apuntados como fraudulentos por el Rastreador de Papers Problemáticos (Problematic Paper Screener), una herramienta lanzada en 2022 que identifica las llamadas “frases torturadas”, expresiones mal traducidas que ponen en evidencia el uso de programas de inteligencia artificial. Los textos pasan por múltiples traducciones a los efectos de disminuir la similitud de sus contenidos, en un intento de burlar la acción de los sistemas de detección de plagios. El problema radica en que pueden volverse incomprensibles: el término big data, por ejemplo, consagrado para designar a la utilización de grandes volúmenes de datos, daba lugar a la expresión sin sentido colossal information (información colosal). Un grupo encabezado por el científico de la computación francés Guillaume Cabanac, de la Universidad de Toulouse (lea en Pesquisa FAPESP, edición nº 317), fue el que creó esta herramienta.

La convergencia entre los resultados del nuevo modelo y los del Rastreador de Papers Problemáticos varió de país en país. De los 345 artículos de investigadores de Arabia Saudita que contenían frases torturadas, 317 (el 92 % del total) también fueron caratulados como anómalos con el nuevo método. La coincidencia fue del 74 % en trabajos de investigadores de Irán, del 44 % en el caso de Estados Unidos y del 25 % en el de China. En cifras absolutas, el destacado fue la India, con 773 estudios con redes de autores anómalas, un 46 % de los 1.666 con expresiones distorsionadas, identificados por Cabanac.

En 2022, el Committee on Publication Ethics −un foro de editores científicos dedicado a las cuestiones referentes a la integridad en la investigación científica− estimó que el 2 % de los artículos remitidos para su publicación sale de fábricas de papers. De acuerdo con los responsables del modelo, el científico de la información Simon Porter y la epidemióloga Leslie McIntosh, algunas editoriales aparecieron más expuestas a los manuscritos fraudulentos. Hindawi, brazo de la editorial Wiley cuyas revistas fueron objeto de 8.000 retractaciones en 2023 por fraudes en la revisión por pares, es la que exhibió un mayor perfil de riesgo: en 2022, el 4 % de su producción publicada estaba asociado a fábricas de papers. Tras el escándalo, Wiley abandonó la marca Hindawi e incorporó todos sus títulos. La editorial MDPI también vio su producción bastante afectada, con un índice del 3 % de artículos fabricados.

Porter y McIntosh son vicepresidentes de la empresa de tecnología Digital Science, vinculada al grupo Springer Nature. Según ellos, el problema parece estar adquiriendo mayores dimensiones. “A partir de 2018, se detecta una transición en las conductas que duplica la aparición relativa de investigadores de perfil inusual durante un período de cuatro años”, escribieron. Existen modos a través de los cuales las fábricas de la papers intentan escamotear las huellas digitales de los fraudes. Algunas ya han añadido nombres de investigadores consagrados, sin que los mismos tengan conocimiento, a sus listas de autores de artículos, para fraguar una apariencia respetable en la red de colaboradores, pero el riesgo de que este artilugio se descubra, mediante la identificación del estudio fabricado y la revelación de la trama, no es desdeñable. Otro recurso, de acuerdo con la dupla de investigadores, consiste en cooptar económicamente a científicos con carreras modestas para que firmen los artículos comercializados y así darles una apariencia menos sospechosa, pero esto les genera costos extras a los servicios fraudulentos.

La propagación de herramientas de la inteligencia artificial permite vislumbrar que los fraudes podrán volverse más sofisticados y de difícil detección con base únicamente en el análisis de los textos y los gráficos. De allí la importancia del nuevo método, que ayudaría a rastrear un tipo más amplio de artículos con perfiles atípicos. “Al entender los abordajes tecnológicos adoptados por las fábricas de papers, así como las estructuras sociales que las mismas necesitan para operar, la comunidad científica puede desarrollar estrategias que dificulten su operación o que la misma sea idealmente imposible”, escribieron los autores.

Republicar