{"id":257559,"date":"2018-06-01T16:47:17","date_gmt":"2018-06-01T19:47:17","guid":{"rendered":"http:\/\/revistapesquisa.fapesp.br\/?p=257559"},"modified":"2018-08-22T19:13:46","modified_gmt":"2018-08-22T22:13:46","slug":"de-quien-es-esta-firma","status":"publish","type":"post","link":"https:\/\/revistapesquisa.fapesp.br\/es\/de-quien-es-esta-firma\/","title":{"rendered":"\u00bfDe qui\u00e9n es esta firma?"},"content":{"rendered":"<p>Licenciados en ciencias de la computaci\u00f3n de la Universidad Federal de R\u00edo de Janeiro (UFRJ) propusieron un nuevo abordaje para enfrentar el problema de la ambig\u00fcedad de firmas de autores cient\u00edficos en las referencias bibliogr\u00e1ficas, que lleva a que la producci\u00f3n de un investigador pueda confundirse con la de otros colegas que adoptan una abreviatura id\u00e9ntica o bien, que sea dif\u00edcil de agrupar y analizar porque el mismo investigador utiliza firmas diferentes. En un art\u00edculo publicado en el mes de mayo en la revista <em>Scientometrics<\/em>, la licenciada en ciencias de la computaci\u00f3n Janaina Gomide y su director de tesis doctoral, Daniel Ratton Figueiredo, docente del Programa de Ingenier\u00eda de Sistemas y Computaci\u00f3n de la UFRJ, revelaron la existencia de comportamientos que se repiten entre los autores que utilizan varias firmas.<\/p>\n<p>Uno de ellos es el cambio raro o accidental de la firma en alguno de los <em>papers<\/em> publicados, una especie de punto fuera de la curva causado por un error o descuido del autor o de la revista. Otro patr\u00f3n de conducta es el del investigador que firma de una manera al comienzo de su carrera y, a partir de cierto momento, comienza a firmar de otra forma, como en el caso, por ejemplo, de las mujeres que cambian de apellido cuando se casan o se divorcian. Y tambi\u00e9n, finalmente, existe el caso de una pauta m\u00e1s dif\u00edcil de detectar, la del acad\u00e9mico que firma de varias formas sin preocuparse por una estandarizaci\u00f3n de su firma.<\/p>\n<p>Los analistas evaluaron la incidencia de esos comportamientos en dos \u00e1mbitos distintos. Uno de ellos fue la base de datos del Digital Bibliographic Library Project (DBLP), que engloba la producci\u00f3n de cient\u00edficos de la computaci\u00f3n y se utiliza con frecuencia como referencia en estudios sobre ambig\u00fcedad, porque ya se han mapeado los casos en que aparecen patrones de firma repetitivos. Tambi\u00e9n se analiz\u00f3 a 881 investigadores brasile\u00f1os cuyos perfiles en el Google Scholar exhib\u00edan m\u00e1s de un tipo de firma, seleccionados entre los becarios de productividad del Consejo Nacional de Desarrollo Cient\u00edfico y Tecnol\u00f3gico (CNPq).<\/p>\n<p>Se revel\u00f3 que la sustituci\u00f3n accidental de la firma es lo m\u00e1s frecuente, con un 43% de los registros en el DBLP y un 53% en el Google Scholar. El cambio de firma en determinado momento de la carrera suma un tercio de los casos en el DBLP y un 18% en Google Scholar. En tanto, la variaci\u00f3n frecuente de firmas se revel\u00f3 como algo un poco m\u00e1s com\u00fan entre los autores nacionales en Google Scholar, con un tercio de los casos, y menos habitual en el DBLP, que agrupa a investigadores de varios pa\u00edses, con un 25% del total. Una de las explicaciones para el cambio frecuente de firma entre los brasile\u00f1os reside en el uso de nombres compuestos en el pa\u00eds y de m\u00e1s de un apellido propicia la confusi\u00f3n. \u201cTenemos muchos apellidos y los utilizamos en forma libre, mientras que los autores de Estados Unidos se identifican, por lo general, tan s\u00f3lo con el primero y el \u00faltimo nombre\u201d, explica Daniel Figueiredo, que incluso \u00e9l mismo es una de las v\u00edctimas de ese inconveniente: la mayor\u00eda de sus art\u00edculos cient\u00edficos lleva la firma Figueiredo, D. R., pero hay otros que figuran como Figueiredo, Daniel o tambi\u00e9n, Figueiredo, Daniel R.<\/p>\n<p>El paso siguiente del trabajo consisti\u00f3 en un an\u00e1lisis de las redes de colaboraci\u00f3n de los investigadores que publican con m\u00e1s de una firma. Se observ\u00f3 que cada una de las tres clases \u2013el uso ocasional de una u otra firma, el cambio de firma en cierto momento de la carrera y el uso frecuente de varias firmas\u2013 presenta redes de colaboraci\u00f3n con pautas claras y espec\u00edficas, cuyos perfiles pueden ser \u00fatiles para formular en un futuro algoritmos capaces de ayudar en la identificaci\u00f3n de nombres ambiguos. \u201cDilucidar la ambig\u00fcedad de nombres es un problema cl\u00e1sico de la computaci\u00f3n y lo que siempre se intenta hacer consiste en hallar todos los r\u00f3tulos, los tipos de firma, que aluden a una misma identidad\u201d, dice Janaina Gomide. \u201cNuestra labor contribuy\u00f3 a revelar las causas comunes de la ambig\u00fcedad, que ya se conoc\u00edan de manera intuitiva, pero a\u00fan no hab\u00edan sido calibradas, proponiendo su utilidad para la construcci\u00f3n de nuevos algoritmos\u201d, agrega Figueiredo.<\/p>\n<p><strong><a href=\"http:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-2.jpg\"><img loading=\"lazy\" decoding=\"async\" width=\"2734\" height=\"2669\" class=\"alignleft size-full wp-image-257561\" src=\"http:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-2.jpg\" alt=\"\" srcset=\"https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-2.jpg 2734w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-2-250x244.jpg 250w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-2-700x683.jpg 700w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-2-120x117.jpg 120w\" sizes=\"auto, (max-width: 2734px) 100vw, 2734px\" \/><span class=\"media-credits-inline\">Daniel Kondo<\/span><\/a>Confusi\u00f3n en la evaluaci\u00f3n<\/strong><br \/>\nEl inter\u00e9s de los investigadores cient\u00edficos por este tema se explica tanto por el desaf\u00edo de generar herramientas computacionales para resolver un problema concreto como por la confusi\u00f3n que las ambig\u00fcedades causan a la hora de medir la producci\u00f3n de un cient\u00edfico, provocando alteraciones en procesos de evaluaci\u00f3n o en estudios bibliom\u00e9tricos que requieren de informaciones precisas acerca de los autores. En un estudio publicado en 2012 en el peri\u00f3dico <em>Sigmod Record<\/em>, una publicaci\u00f3n trimestral de la Association for Computing Machinery (ACM), el brasile\u00f1o Alberto Laender, docente del Departamento de Ciencia de la Computaci\u00f3n de la Universidad Federal de Minas Gerais (UFMG), contabiliz\u00f3 17 m\u00e9todos computacionales distintos que se empleaban en ese entonces para resolver el problema de la ambig\u00fcedad. \u201cHoy ya debe haber por lo menos unos 30 algoritmos diferentes en uso\u201d, comenta.<\/p>\n<p>El grupo de la UFMG elabor\u00f3 tres de esos algoritmos. Uno de ellos, conocido por la sigla HHC (Heuristic-based Hierarchical Clustering), fue presentado en 2007 y comenz\u00f3 a ser utilizado por la DBLP, la misa base de datos que se us\u00f3 en el estudio de Daniel Figueiredo, como una de las herramientas m\u00e1s simples para afrontar el problema. Fruto de una tesina de maestr\u00eda que defendiera Ricardo Cota en la UFMG, el HHC re\u00fane las informaciones bibliogr\u00e1ficas vinculadas a una firma y analiza si existen coautores que se repitan. Cuando detecta una coincidencia, tambi\u00e9n analiza si los t\u00edtulos de los art\u00edculos contienen palabras en com\u00fan o bien, si los autores tomaron parte en los mismos eventos cient\u00edficos. La eficiencia para disipar la ambig\u00fcedad alcanz\u00f3 un porcentaje cercano al 80%. \u201cEl m\u00e9todo comenz\u00f3 a utilizarse por su simplicidad, aunque la b\u00fasqueda por algoritmos cada vez m\u00e1s precisos prosigui\u00f3\u201d, dice Laender. \u201cHay casos en los que no existe un algoritmo capaz de resolver el problema. Entre los autores con nacionalidad china, cuyos apellidos se repiten con frecuencia y hay una gran cantidad de abreviaciones coincidentes, llega a ser algo inviable\u201d.<\/p>\n<p>Un segundo m\u00e9todo creado por investigadores de la UFMG fue el Sand (<em>Self-training Associative Name Disambiguator<\/em>), que agrupa referencias bibliogr\u00e1ficas de acuerdo con caracter\u00edsticas comunes, tales como la presencia de coautores, t\u00edtulo y a\u00f1o de publicaci\u00f3n. Vali\u00e9ndose de t\u00e9cnicas de inteligencia artificial, consigue detectar, en su etapa final, si hay autores que, dadas sus caracter\u00edsticas, deber\u00edan pertenecer a determinados agrupamientos, y calcular las posibilidades de que tales registros sean referencias ambiguas de otros autores ya existentes. \u201cEstas t\u00e9cnicas de clasificaci\u00f3n son bastante conocidas y uno de nuestros exalumnos de doctorado, Anderson Ferreira, en la actualidad, docente de la Universidad Federal de Ouro Preto, las adapt\u00f3 para su desambiguaci\u00f3n. El programa Sand realiza una comparaci\u00f3n en diferentes clases de las referencias hasta arribar a la conclusi\u00f3n de que un determinado autor tiene que figurar en una de esas clases\u201d, dice Laender. Y el tercer m\u00e9todo es el IDNi (<em>Incremental Unsupervised Name Disambiguation<\/em>), que asocia diversas t\u00e9cnicas y se utiliza para evaluar nuevos trabajos cient\u00edficos incorporados a bases de datos, asoci\u00e1ndolos en forma autom\u00e1tica a perfiles de autores existentes y evitando el surgimiento de nuevas ambig\u00fcedades.<\/p>\n<p><strong><a href=\"http:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-3.jpg\"><img loading=\"lazy\" decoding=\"async\" width=\"1429\" height=\"1206\" class=\"alignright size-full wp-image-257562\" src=\"http:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-3.jpg\" alt=\"\" srcset=\"https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-3.jpg 1429w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-3-250x211.jpg 250w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-3-700x591.jpg 700w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2018\/05\/042-044_assinaturas_257-3-120x101.jpg 120w\" sizes=\"auto, (max-width: 1429px) 100vw, 1429px\" \/><span class=\"media-credits-inline\">Daniel Kondo<\/span><\/a>Modelos de conectividad<\/strong><br \/>\nLa combinaci\u00f3n de distintas metodolog\u00edas puede conducir a resultados m\u00e1s exactos. El investigador Diego Raphael Amancio, del Instituto de Ciencias Matem\u00e1ticas y de la Computaci\u00f3n de la Universidad de S\u00e3o Paulo (ICMC-USP), concibi\u00f3 un m\u00e9todo para solucionar ambig\u00fcedades de firmas basado en el an\u00e1lisis de las redes de colaboraci\u00f3n de los autores, aunque no se limita a analizar qui\u00e9n actu\u00f3 en colaboraci\u00f3n con qui\u00e9n. Su estrategia analiza los modelos de conectividad de una amplia red de investigadores y muestra la situaci\u00f3n de cada autor en ese universo. \u201cUtilizando conceptos de la teor\u00eda de redes complejas, se pueden generar grafos, evaluar la densidad de las conexiones entre autores y la distancia promedio entre el investigador que estoy estudiando y los dem\u00e1s\u201d, explica Amancio, quien propuso el empleo de tales medidas para caracterizar la producci\u00f3n de un autor y compararla con la de otro con el mismo nombre, con el objetivo de resolver problemas de ambig\u00fcedad. \u00c9l fue el autor principal de un art\u00edculo publicado en 2015 en la <em>Scientometrics<\/em> que demostr\u00f3 la eficiencia del uso de esa t\u00e9cnica combinada con el an\u00e1lisis de modelos de colaboraci\u00f3n ya afianzado. La misma revel\u00f3, en simulaciones con un conjunto de tres bases de datos elegidas para el estudio, que la capacidad de solucionar ambig\u00fcedades mediante esa estrategia h\u00edbrida alcanz\u00f3 un 85%, frente a un 53% cuando solamente se utilizaba el abordaje tradicional.<\/p>\n<p>Al mismo tiempo que amplific\u00f3 el problema de la ambig\u00fcedad en las referencias bibliogr\u00e1ficas, el crecimiento de la producci\u00f3n cient\u00edfica mundial inspir\u00f3 nuevas soluciones que pasaron a incluirse en los algoritmos. En 2012 se cre\u00f3 un c\u00f3digo alfanum\u00e9rico que sirve como identificaci\u00f3n \u00fanica para los investigadores. Bautizado con el nombre de Orcid (<em>Open Researcher and<\/em> <em>Contributor ID<\/em>), comenzaron a exigir ese n\u00famero las instituciones y agencias de fomento, y aglutina la producci\u00f3n de cada autor en forma autom\u00e1tica (<a href=\"http:\/\/revistapesquisa.fapesp.br\/en\/2016\/05\/02\/an-id-card-for-researchers\/\" target=\"_blank\" rel=\"noopener\"><em>lea en <\/em>Pesquisa FAPESP<em>, edici\u00f3n n\u00ba 238<\/em><\/a>). Ya hay m\u00e1s de 2 millones de autores que cuentan con su identificaci\u00f3n particular. \u201cPero no todos los investigadores utilizan ese c\u00f3digo y a\u00fan es necesario utilizar m\u00e9todos emp\u00edricos para el an\u00e1lisis de bibliotecas antiguas\u201d, dice Alberto Laender. Daniel Figueiredo acota que el conocimiento acumulado en el esfuerzo contra la ambig\u00fcedad de nombres podr\u00eda tener otras aplicaciones. \u201cSe pueden utilizar esas herramientas en otros contextos\u201d, a\u00f1ade. Uno de ellos es el agrupamiento de informaciones de historias cl\u00ednicas de un mismo paciente que fue atendido en hospitales p\u00fablicos o centros de salud distintos. \u201cTambi\u00e9n pensamos en estudiar el patr\u00f3n de uso de nombres con ambig\u00fcedad de actores y realizadores en archivos filmogr\u00e1ficos, tales como el Internet Movie Database\u201d, informa Figueiredo.<\/p>\n","protected":false},"excerpt":{"rendered":"Cient\u00edficos de la computaci\u00f3n crean nuevas estrategias para disipar ambig\u00fcedades en referencias bibliogr\u00e1ficas","protected":false},"author":11,"featured_media":257560,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[189],"tags":[284,288],"coauthors":[98],"class_list":["post-257559","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-politica-ct","tag-cienciometria-es","tag-computacion"],"acf":[],"_links":{"self":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/257559","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/comments?post=257559"}],"version-history":[{"count":0,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/257559\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/media\/257560"}],"wp:attachment":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/media?parent=257559"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/categories?post=257559"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/tags?post=257559"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/coauthors?post=257559"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}