{"id":452372,"date":"2022-09-23T15:21:23","date_gmt":"2022-09-23T18:21:23","guid":{"rendered":"https:\/\/revistapesquisa.fapesp.br\/?p=452372"},"modified":"2022-09-26T16:32:26","modified_gmt":"2022-09-26T19:32:26","slug":"las-traducciones-mal-hechas-apuntan-la-mala-conducta-en-los-articulos-cientificos","status":"publish","type":"post","link":"https:\/\/revistapesquisa.fapesp.br\/es\/las-traducciones-mal-hechas-apuntan-la-mala-conducta-en-los-articulos-cientificos\/","title":{"rendered":"Las traducciones mal hechas apuntan la mala conducta en los art\u00edculos cient\u00edficos"},"content":{"rendered":"<p>Un grupo de investigadores de Franca y Rusia estudi\u00f3 la presencia frecuente de expresiones sin sentido en art\u00edculos publicados en revistas de ciencias de la computaci\u00f3n. En lugar de utilizar el t\u00e9rmino en ingl\u00e9s <em>artificial intelligence <\/em>(inteligencia artificial), hab\u00eda art\u00edculos que se refer\u00edan a ese campo del conocimiento como <em>counterfeit consciousness<\/em>, algo as\u00ed como percepci\u00f3n simulada. Del mismo modo, <em>big data<\/em>, macrodatos, un t\u00e9rmino empleado com\u00fanmente para denominar la utilizaci\u00f3n de grandes vol\u00famenes de datos, en ocasiones fue sustituido por algo con un sentido parecido, pero en la pr\u00e1ctica inusual: <em>colossal information <\/em>(informaci\u00f3n colosal).<\/p>\n<p>En un estudio publicado el a\u00f1o pasado en el repositorio arXiv, los cient\u00edficos de la computaci\u00f3n Guillaume Cabanac, de la Universidad de Toulouse, Ciryl Labb\u00e9, de la Universidad de Grenoble, ambos franceses, y el ruso Alexander Magazinov, de la empresa de <em>software<\/em> Yandex, arribaron a la conclusi\u00f3n de que esos t\u00e9rminos, bautizados por ellos como \u201cfrases torturadas\u201d, pueden ser se\u00f1al de diversos tipos de mala conducta. El m\u00e1s com\u00fan es el plagio. Las expresiones suenan extra\u00f1as porque se traducen autom\u00e1ticamente del ingl\u00e9s a otro idioma y luego se vuelven a convertir al ingl\u00e9s para simular una par\u00e1frasis y enga\u00f1ar al <em>software <\/em>de detecci\u00f3n de plagio.<\/p>\n<p>M\u00e1s all\u00e1 de ser raros, los t\u00e9rminos mal traducidos dificultan la comprensi\u00f3n de los textos, haci\u00e9ndolos imprecisos o incluso err\u00f3neos. Pero las \u201cfrases torturadas\u201d pueden ser el preludio de un problema m\u00e1s grave. Tambi\u00e9n se las ha detectado en <em>papers<\/em> totalmente fraudulentos, generados por modelos de lenguaje que hacen uso de la inteligencia artificial. \u201cA diferencia de los art\u00edculos en los que los autores utilizan la par\u00e1frasis como recurso, para alterar un texto existente, estos modelos de inteligencia artificial pueden generar un texto de la nada\u201d, explicaron Cabanac, Labb\u00e9 y Magazinov en un trabajo publicado en enero de este a\u00f1o en el sitio web del <em>Bulletin of the Atomic Scientist<\/em>. Concretamente, ellos se refieren a una red neural llamada GPT-2, desarrollada por el instituto privado de investigaciones OpenAI, de Estados Unidos, capaz de generar estructuras coherentes que parecen haber sido escritas por personas. El a\u00f1o pasado, el grupo el grupo analiz\u00f3 140.000 res\u00famenes de art\u00edculos con un detector de textos generados v\u00eda GPT-2, creado por el propio OpenAI. \u201cCientos de trabajos sospechosos aparec\u00edan en decenas de publicaciones de renombre\u201d, escribi\u00f3 el tr\u00edo de investigadores.<\/p>\n<p>Los programas capaces de generar art\u00edculos falsos no son una novedad, pero hasta hace poco el resultado era tan malo que solo consegu\u00edan enga\u00f1ar a algunos incautos o a personas muy negligentes. En 2005, tres alumnos del Instituto de Tecnolog\u00eda de Massachusetts (MIT), dise\u00f1aron un <em>software<\/em> al que bautizaron SciGEN, capaz de combinar secuencias de palabras extra\u00eddas de <em>papers<\/em> genuinos para componer textos que, sin embargo, no tienen ning\u00fan sentido (<a href=\"https:\/\/revistapesquisa.fapesp.br\/es\/articulos-nonsense\/\" target=\"_blank\" rel=\"noopener\"><em>lea en <\/em>Pesquisa FAPESP<em>, edici\u00f3n n\u00ba 219<\/em><\/a>). Ese mismo a\u00f1o, presentaron uno de aquellos manuscritos en una conferencia mundial sobre cibern\u00e9tica e inform\u00e1tica celebrada en Estados Unidos y lograron publicarlo: el prop\u00f3sito del grupo del MIT era demostrar que el proceso de revisi\u00f3n por pares en los anales de las conferencias suele ser defectuoso. Esta herramienta que empez\u00f3 como una broma se convirti\u00f3 en un arma para el fraude. En 2012, el cient\u00edfico de la computaci\u00f3n Cyril Labb\u00e9 demostr\u00f3 que el <em>software<\/em> de los estudiantes del MIT, que se encuentra disponible en internet, estaba siendo utilizado por falsificadores: descubri\u00f3 art\u00edculos generados por el SciGEN en los anales de m\u00e1s de 30 conferencias. Labb\u00e9 desarroll\u00f3 un programa para identificarlos por medio de palabras clave, que fue adoptado por las editoriales cient\u00edficas para prevenir el problema.<\/p>\n<p>Los avances en inteligencia artificial alentaron este tipo de fraudes. Cabanac y sus colaboradores crearon entonces una herramienta m\u00e1s potente, a la cual denominaron rastreador de <em>papers<\/em> problem\u00e1ticos, que busca art\u00edculos con \u201cfrases torturadas\u201d. Los voluntarios recopilaron expresiones frecuentemente mal traducidas en art\u00edculos de diversas \u00e1reas del conocimiento para abastecer la base de datos del rastreador. En ese cat\u00e1logo, <em>irregular esteem <\/em>(que podr\u00eda traducirse como estimaci\u00f3n irregular) aparece como un supuesto equivalente de la expresi\u00f3n <em>random value <\/em>(valor aleatorio), una expresi\u00f3n com\u00fan en el campo del an\u00e1lisis estad\u00edstico. Un caso extravagante es el del t\u00e9rmino <em>bosom peril<\/em> (peligro en el pecho), reemplazando la expresi\u00f3n <em>breast cancer <\/em>(c\u00e1ncer de mama).<\/p>\n<p>Ni siquiera los estudios sobre el covid-19 se salvaron: en algunos, al S\u00edndrome Respiratorio Agudo Grave (Sars) lo transformaron en algo as\u00ed como S\u00edndrome Respiratorio Extremadamente Intenso. Uno de esos art\u00edculos, firmado por el m\u00e9dico egipcio Ahmed Elgazzar, de la Universidad de Banha, fue retirado de la plataforma de <em>preprints<\/em> Research Square por los indicios de mala conducta que iban m\u00e1s all\u00e1 de la terminolog\u00eda inapropiada. El estudio, que suger\u00eda la eficacia de la ivermectina \u2013un antiparasitario\u2013 contra el virus Sars-CoV-2, fue considerado inv\u00e1lido debido a las discrepancias detectadas entre los datos brutos de la investigaci\u00f3n y los protocolos del ensayo cl\u00ednico. Adem\u00e1s de la traducci\u00f3n err\u00f3nea de la sigla Sars, presentaba evidencias de plagio de comunicados de prensa sobre la ivermectina que resistieron los trucos para parafrasear los textos originales.<\/p>\n<p>Las revistas que publican manuscritos con expresiones mal traducidas pueden tener otros fallos en sus controles de calidad. Cabanac realiz\u00f3 una b\u00fasqueda en la base de datos Dimensions en procura de documentos cient\u00edficos que incluyeran los t\u00e9rminos que hab\u00eda recopilado. Se detectaron 860 art\u00edculos con alguna \u201cfrase torturada\u201d y 31 de ellos figuraban en una misma publicaci\u00f3n: <em>Microprocessors &amp; Microsystems<\/em>, de la editorial Elsevier. El cient\u00edfico de la computaci\u00f3n entonces descarg\u00f3 la totalidad de los textos publicados por la revista entre 2018 y 2021 y realiz\u00f3 un examen m\u00e1s minucioso. Encontr\u00f3 alrededor de 500 casos problem\u00e1ticos que, en su mayor\u00eda, inclu\u00edan irregularidades en el proceso de revisi\u00f3n por pares. Gran parte de los <em>papers<\/em> sospechosos hab\u00edan sido publicados en ediciones tem\u00e1ticas especiales y presentaban una misma fecha de env\u00edo, revisi\u00f3n y aceptaci\u00f3n, lo que probaba que no hab\u00edan sido evaluados con un m\u00ednimo de cuidado.<\/p>\n<p>Una investigaci\u00f3n paralela llevada a cabo por Elsevier corrobor\u00f3 los hallazgos del franc\u00e9s y 165 art\u00edculos fueron retirados o retractados. De acuerdo con el comunicado que emiti\u00f3 la editorial, \u201cse investig\u00f3 la integridad y la rigurosidad del proceso de revisi\u00f3n por pares y se constat\u00f3 que estaban por debajo de los altos est\u00e1ndares que se esperan para <em>Microprocessors &amp; Microsystems<\/em>\u201d. Tambi\u00e9n se detectaron indicios de que gran parte de las ediciones especiales inclu\u00edan contenidos \u201cno originales y muy parafraseados\u201d.<\/p>\n<p>La editorial Elsevier no fue la \u00fanica que tuvo que afrontar este problema. En el mes de marzo, IOP Publishing, del Reino Unido, anunci\u00f3 la retractaci\u00f3n de 350 art\u00edculos publicados en dos de sus revistas: <em>The Journal of Physics: Conference Series<\/em> e <em>IOP Conference Series: Materials Science and Engineering<\/em>, que re\u00fanen las anales de conferencias de los campos de la f\u00edsica, la ciencia de materiales y las ingenier\u00edas. Muchos de ellos conten\u00edan \u201cfrases torturadas\u201d. Esos <em>papers<\/em> fueron descubiertos por Nick Wise, un estudiante de ingenier\u00eda de la Universidad de Cambridge que utiliz\u00f3 el rastreador creado por el grupo de Cabenac para analizar las revistas.<\/p>\n","protected":false},"excerpt":{"rendered":"Investigadores recopilan \u201cfrases torturadas\u201d tendientes a disimular plagios y fraudes en <em>papers<\/em>","protected":false},"author":11,"featured_media":452373,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[178],"tags":[284,288,299],"coauthors":[98],"class_list":["post-452372","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-buenas-practicas","tag-cienciometria-es","tag-computacion","tag-etica-es"],"acf":[],"_links":{"self":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/452372","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/comments?post=452372"}],"version-history":[{"count":2,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/452372\/revisions"}],"predecessor-version":[{"id":453722,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/452372\/revisions\/453722"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/media\/452373"}],"wp:attachment":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/media?parent=452372"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/categories?post=452372"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/tags?post=452372"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/coauthors?post=452372"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}