Imprimir Republicar

BOAS PRÁTICAS

Semelhança suspeita

A quantidade de artigos científicos fraudulentos produzidos pelas chamadas fábricas de papers pode ser maior do que se calcula. Uma análise feita por um software de inteligência artificial rastreou cerca de 400 mil artigos publicados nas últimas duas décadas cujos títulos e resumos contêm semelhanças estilísticas com os de trabalhos comprovadamente falsificados. Desse total, 70 mil artigos foram publicados no ano passado. Segundo a avaliação, entre 1,5% e 2% de todos os artigos produzidos em 2022 têm aspectos em comum com papers forjados – esse índice chega a 3% entre os trabalhos de biologia e medicina.

O panorama supera largamente os registros oficiais desse tipo de má conduta – de acordo com a base de dados do site Retraction Watch, que reúne dezenas de milhares de artigos retratados, cerca de 3 mil dos trabalhos invalidados tiveram como origem fábricas de papers. Esses serviços fraudulentos, presentes em vários países, geram artigos com dados ou imagens forjados, vendem a autoria dos trabalhos a pessoas interessadas em ampliar artificialmente sua produção científica e até ajudam a submeter os manuscritos para publicação em nome dos clientes. Os artigos são preparados em grande quantidade e frequentemente se baseiam em modelos com características comuns – às vezes, repetem uma mesma estrutura apenas substituindo palavras por sinônimos ou fabricando diferentes versões de uma imagem.

A análise sobre o número de papers suspeitos foi divulgada em uma reportagem da revista Nature e é baseada em dados processados por Adam Day, diretor da empresa Clear Skies, em Londres, na Inglaterra. A verificação foi feita pelo software Papermill Alarm, que vem sendo adotado por revistas científicas para detectar trabalhos potencialmente fraudulentos. A ferramenta não garante que um manuscrito é fabricado, mas aponta artigos que merecem uma investigação mais aprofundada antes de ser aceitos para publicação. Como trabalhos legítimos podem ter semelhanças estilísticas com fraudulentos, os resultados da análise certamente contêm falsos positivos, mas Day afirma que ajustou seu modelo para reduzir esse risco. “Era preciso haver um grande indício para que o paper fosse sinalizado”, explicou à Nature.

O programa usa técnicas de aprendizagem profunda (deep learning) e foi configurado para analisar títulos e resumos de mais de 48 milhões de artigos publicados desde 2000, confrontando sua linguagem com a de artigos sabidamente produzidos por esses serviços ilegais. A comparação se baseia em listas de trabalhos falsos compiladas por especialistas em fraudes em trabalhos acadêmicos, como Elisabeth Bik, nos Estados Unidos, e David Bimler, na Nova Zelândia. “Embora incrivelmente altas, as estimativas apontadas pelo software não são impossíveis”, afirmou Bik, segundo a Nature. Ela ressalva que não teve acesso à metodologia do Papermill Alarm e, por isso, não pode avaliar sua precisão.

É certo que os serviços ilegais vêm sofisticando suas técnicas e tornando mais complexa a tarefa de combatê-los. A plataforma STM Integrity Hub, que auxilia editores no escrutínio de manuscritos submetidos para publicação, utiliza softwares – o Papermill Alarm é apenas um deles – para rastrear 70 diferentes sinais de manipulação comuns em artigos produzidos por fábricas de papers, como imagens com sinais de adulteração, uso intensivo de ferramentas de tradução para escamotear sinais de plágio e endereços de e-mail suspeitos.

Republicar