Imprimir Republicar

Boas práticas

Redes neurais conseguem deduzir quem é o autor de três em cada quatro artigos, mostra estudo

Na revisão por pares de modelo duplo-cego, os avaliadores de um artigo, cuja identidade é mantida em segredo mesmo após sua publicação, não sabem o nome nem a afiliação dos autores do trabalho que estão analisando – o duplo anonimato é visto como uma garantia de uma revisão independente e isenta. Avanços da inteligência artificial, contudo, podem comprometer a confiabilidade dessa modalidade de revisão, conforme mostrou um artigo publicado no final de junho na revista PLOS ONE.

Pesquisadores da Universidade de Zurique, na Suíça, desenvolveram uma arquitetura de redes neurais, sistema inspirado na organização do sistema nervoso humano e baseado em aprendizado de máquina, que foi capaz de apontar quem é o autor de um trabalho científico com 73,4% de sucesso. Foi criado um banco de dados de atribuição de autoria composto pelos nomes de pesquisadores que assinam 2 milhões de manuscritos, além de seus conteúdos e referências bibliográficas. Os trabalhos foram depositados nos últimos anos no repositório de preprints ArXiv. O volume gigantesco de informações foi usado para treinar algoritmos a identificar padrões similares em outros artigos e inferir quem os escreveu.

O sistema conseguiu deduzir corretamente quem era o autor de três em cada quatro documentos – no caso de pesquisadores prolíficos, que produzem um número maior de trabalhos, a precisão foi ampliada para 85%. “Após os êxitos recentes da inteligência artificial (…), esses resultados podem não ser surpreendentes, mas nossas descobertas têm implicações significativas para a integridade do processo de revisão duplo-cego”, escreveram os autores, os especialistas em robótica Leonard Bauersfeld, Angel Romero, Manasi Muglikar e Davide Scaramuzza, em um texto publicado em um blog da London School of Economics and Political Science.

Segundo eles, compreender como a inteligência artificial conseguiu inferir a autoria de um artigo traz lições para quem deseja preservar o anonimato no momento de submeter seu artigo científico a um periódico. O grupo constatou que, apenas analisando as primeiras 512 palavras de um artigo, já há informações suficientes para uma “atribuição robusta” de autoria – o desempenho do modelo melhora muito pouco ao considerar o restante do texto. “O resumo e a introdução [de um artigo] frequentemente refletem a identidade criativa dos autores e o domínio de pesquisa deles. Essas características distintas facilitam a identificação do autor, principalmente porque eles costumam reformular, nos artigos que são submetidos, as frases de introdução de seus trabalhos anteriores”, afirmaram.

O costume de pesquisadores de citar seus próprios trabalhos nas referências bibliográficas de um novo artigo pode ser decisivo para o veredicto das redes neurais. “Confirmamos a hipótese de que os autores citam a si mesmos com muita frequência. Em média, os artigos em nosso conjunto de dados contêm 10,8% de autocitações, servindo como uma indicação fácil de sua identidade. Assim, encorajamos os autores a evitar muitas autocitações na submissão a uma revisão duplo-cega para preservar o anonimato”, concluíram. As demais referências bibliográficas podem facilitar ou dificultar o trabalho dos algoritmos. “Ao incluir citações de artigos pouco conhecidos, os autores podem reforçar seu anonimato”, escreveram.

Republicar