ELISA CARARETOLa Plataforma Lattes, que reúne más de cuatro millones de currículos académicos, se ha transformado en fuente de información para una cantidad creciente de investigadores que buscan datos sobre la ciencia brasileña con el objetivo de estudiar sus fenómenos y tendencias. El sistema de currículos, creado en 1999 por el Consejo Nacional de Desarrollo Científico y Tecnológico (CNPq), registra la trayectoria y contribución a la ciencia de cada estudiante, técnico e investigador de Brasil y proporciona al gobierno y a los organismos de fomento de la investigación informaciones sobre la producción científica, participación en proyectos y direcciones y supervisiones, entre otros. Su utilidad, no obstante, hace tiempo que ha superado la esfera de la gestión y ayuda a los investigadores en la producción de conocimiento original. “Pocos países disponen de una plataforma con las actividades de su comunidad científica en todo su conjunto”, dice Rogério Mugnaini, docente de la Escuela de Comunicación y Artes (ECA), de la Universidad de São Paulo (USP).
Mugnaini participa en un proyecto de investigación patrocinado por el CNPq y la USP que explora el desarrollo de herramientas para combinar información de la Plataforma Lattes con datos sobre publicaciones científicas de fuentes nacionales e internacionales. El mes pasado, Mugnaini junto a otros colegas publicaron un artículo en la revista PLOS ONE que analiza la relación entre investigadores sénior en el área de las ciencias exactas y de la Tierra y estudiantes de posgrado bajo su supervisión, utilizando producciones bibliográficas de 1981 a 2010 registradas en la Plataforma Lattes. Se constató que, cuanto más tiempo trabajan juntos, mayor es la productividad del joven investigador que dirigen. “Notamos que parte de los supervisores dejó de tener una línea de investigación propia, pasando a declarar tan sólo artículos de alumnos como producción suya”, afirma. Otro estudio de grupo analizó hasta qué punto las informaciones del Lattes se encuentran actualizadas al comparar datos de los currículos con los obtenidos en informes de programas de posgrado. La conclusión es que la falta de actualización puede afectar hasta un 20% de los artículos publicados en los tres años anteriores. Las áreas de ingenierías y ciencias agrarias son las que más padecen ese problema.
Mugnaini considera viable la creación de indicadores específicos basados en el Lattes. “En las referencias bibliográficas de los currículos Lattes hay información sobre la producción científica en revistas no indexadas en las bases de datos de revistas tradicionales, además de tesis, libros y otros documentos. El Lattes representa una visualización completa del conjunto de la producción científica brasileña y podría proveer para un sistema de evaluación más fidedigno”, sostiene.
ELISA CARARETOLa aparición de una herramienta que ayuda a extraer y ordenar grandes cantidades de datos del Lattes disponibles en internet fue fundamental para facilitar el trabajo de los investigadores. A partir de 2005, se encuentra disponible el scriptLattes, desarrollado por el profesor Roberto M. Cesar-Jr., del Instituto de Matemática y Estadística (IME) de la USP y Jesús Mena-Chalco, por entonces alumno suyo de doctorado y actualmente profesor de la Universidad Federal del ABC (Ufabc). Mena-Chalco también forma parte del grupo de investigación de Mugnaini, bajo la coordinación de Luciano Digiampietri, profesor de la Escuela de Artes, Ciencias y Humanidades (EACH) de la USP. “Nosotros pretendíamos crear una herramienta para uso doméstico del IME, pero terminó siendo útil para mucha gente más”, dice Mena-Chalco. “Antes del scriptLattes, la recopilación de datos del Lattes generalmente se realizaba en forma manual”. El scriptLattes es un software libre que descarga en forma automática los currículos Lattes de un grupo de personas de interés, compara el listado de sus producciones, eliminando los datos duplicados y genera informes, por ejemplo, sobre artículos publicados, supervisiones y redes de coautoría. “La herramienta no suscita datos adicionales, pero logra reunir y organizar, en forma automática, informaciones extraídas de grandes volúmenes de datos. Esas informaciones sirven como base para el revelado de conocimientos.
Al scriptLattes lo están utilizando, actualmente, más de 50 instituciones y grupos de investigación en Brasil. Mena-Chalco emplea la herramienta en dos proyectos. Uno de ellos procura mapear las redes de coautores de artículos científicos, libros y capítulos de libros. Un trabajo publicado en enero de 2014 en el Journal of the Association for Information Science and Technology reveló que el número de colaboraciones entre investigadores brasileños tuvo un avance notable durante las últimas décadas, principalmente en las áreas de ciencias de la salud y ciencias agrarias (lea en Pesquisa FAPESP, edición nº 218). Otro proyecto se propone elaborar árboles genealógicos de científicos, analizando las relaciones de dirección y supervisión. El investigador y sus colaboradores plantean la creación de una plataforma nacional, en la cual sea posible verificar la contribución de cada investigador para la formación de otros. “Ya había propuestas para construir árboles genealógicos en ciertos campos del conocimiento, tales como matemática, física y neurociencia, pero no sobre la comunidad científica de un país”, refiere el investigador. “El análisis de las informaciones sobre relaciones de orientación académica es un intento por determinar la notoriedad de un investigador basándose en su repercusión sobre otras generaciones”.
En tanto, Luciano Digiampietri, docente de la licenciatura en sistemas de información de la EACH-USP, que ha publicado más de una decena de artículos basados en datos del Lattes, también utiliza las informaciones de la plataforma para el desarrollo de algoritmos diseñados para anticipar tendencias. Una de sus investigaciones, en colaboración con William Maruyama, un alumno suyo de maestría, apunta a prever las colaboraciones futuras de un investigador. El estudio tomó datos sobre coautoría de trabajos científicos de investigadores del área de ciencia de la computación registrados en la Plataforma Lattes entre 1970 y 2010. Los datos entre 1970 y 2000 sirvieron para representar los modelos del pasado. Las informaciones entre 2001 y 2005 se utilizaron para representar el presente. El algoritmo comparó los dos intervalos e intentó predecir con quién se relacionarían los investigadores en el futuro. Para legitimar el algoritmo, se comparó a los resultados con los datos registrados entre 2006 y 2010. La representación del futuro realizada por el algoritmo y los que en realidad ocurrió, entre 2006 y 2010 tuvo un índice de coincidencia del 97%.
Otra línea de investigación es el análisis de tendencias en determinados campos del conocimiento. Valiéndose de palabras claves extraídas de los títulos de publicaciones científicas de investigadores de la ciencia de la computación y registradas en el Lattes a lo largo del tiempo, se intentó predecir cuáles serían los temas más estudiados en el futuro próximo. En 2012, la expresión más destacada, según esa metodología, fue “servicios web”, pero en la misma sintonía, está previsto, tanto para 2015 como para 2020, que el campo más candente serán las redes neuronales. El investigador de la EACH-USP también contempla la creación de una herramienta capaz de sugerirle a un investigador artículos de reciente publicación que puedan interesarle, basándose en los temas a los que se dedica. “Comencé a trabajar en esos temas hace cinco años. No tenían nada que ver con lo que hice en el doctorado, pero me fascinaron”, dice Digiampietri.
Fenómenos
Estudios con base en los datos de la Plataforma Lattes están revelando fenómenos poco conocidos o movimientos aún no registrados en indicadores oficiales. El profesor Fabio Mascarenhas, del Departamento de Ciencia de la Información de la Universidad Federal de Pernambuco (UFPE), acaba de derigir la tesina de maestría del estudiante Guilherme Alves de Santana, quien, entre los datos que recopiló sobre cooperación científica, halló una singularidad en la conformación de grupos de investigación en Brasil. “Se analizó la producción científica dentro de grupos de investigación. Suponíamos que íbamos a encontrar más artículos firmados en coautoría entre los miembros de los grupos. Pero notamos que hay mayor colaboración con investigadores ajenos a los grupos que entre ellos”, dijo. El tema será investigado en profundidad en el doctorado de Santana.
Otra curiosidad, que en este caso atañe a la producción científica brasileña en el ámbito de la medicina tropical, se detectó en la tesina de maestría de Natanael Vitor Sobral, también defendida este año. Con base en datos del Programa de Posgrado en Medicina Tropical de la UFPE, se constató que una porción significativa de los artículos publicados en el área no se enfocan directamente en las enfermedades endémicas de Brasil, tales como el dengue, el paludismo o la esquistosomiasis, sino de otras afecciones que concitan mayor interés para las revistas científicas internacionales, como por ejemplo, el Sida. “Ello se explica por la escasa apertura de los grandes periódicos científicos para las enfermedades que afectan a los países pobres si no se encuentran asociadas a temas más universales”, dice Mascarenhas.
El profesor Alberto Laender, titular del Departamento de Ciencia de la Computación de la Universidad Federal de Minas Gerais (UFMG) y miembro de la Academia Brasileña de Ciencias, recabó datos de más de 4 millones de currículos y, con la colaboración de Thiago Magela Rodrigues Dias, alumno de doctorado del Centro Federal de Educación Tecnológica de Minas Gerais, del cual es codirector, está analizando la producción científica de los más de 220 mil doctores con sus currículos registrados en la plataforma, de 64 mil docentes de programas de posgrado y de 15 mil becarios de productividad del CNPq, investigadores estos, a los que la agencia de fomento federal considera los más productivos. “Analizaremos la evolución de la producción en esos tres grupos y en siete grandes áreas del conocimiento”, dice Laender, quien forma parte del Instituto Nacional de Ciencia y Tecnología para la Web (InWeb). Los datos preliminares sugieren que, de manera general, en 2012 comenzó a reducirse la cifra total de publicaciones de la comunidad científica brasileña. Eso, a juicio Laender, puede tener dos orígenes. El primero es el aumento de la carga de trabajo didáctico de los doctores contratados como profesores en universidades federales. “Es posible que ellos ya no logren publicar el mismo volumen de artículos del tiempo en que realizaban el doctorado”, sostiene. Otro motivo, podría ser la expansión de vacantes docentes en institutos federales de educación, donde queda poco espacio para que los doctores investiguen. El descenso de la producción científica, sin embargo, no se detecta entre los docentes de programas de posgrado ni entre los becarios de productividad.
Producción comparada
Laender y su equipo de trabajo poseen una extensa producción de artículos que se basa en datos del currículo Lattes. Han publicado papers sobre el perfil de los investigadores de ciencia de la computación y su producción científica en comparación con la de colegas de América del Norte y de Europa. También utilizaron datos del Lattes para la construcción de un portal en internet (www.cienciabrasil.org.br) donde se puede vislumbrar la producción de los Institutos Nacionales de Ciencia y Tecnología (INCTs).
Una queja frecuente de los investigadores que trabajan con información del Lattes es la dificultad de obtener datos brutos de la plataforma directamente del CNPq. A partir del mes de abril, se tornó más complicada la extracción de información del Lattes en internet, porque el CNPq introdujo un código de confirmación para cada consulta sobre los currículos. Eso se hizo para evitar la creciente extracción de datos de la plataforma por sitios web comerciales. El CNPq tiene como política proveer a cada institución los datos concretos de su cuerpo de investigadores, docentes y alumnos, pero al conjunto de informaciones de la plataforma no se puede acceder tan fácilmente. “La apertura integral de los datos del Lattes sería importante para la comunidad científica. No me refiero a los currículos individuales, sino al conjunto de datos y a la actualización de los mismos para que podamos analizarlos con mayor facilidad”, dice Alberto Laender, de la UFMG.
La analista de ciencia, tecnología e innovación del CNPq, Mônica Ramalho, quien se desempeña en el consejo de planificación, coordinación de estadísticas e indicadores del organismo, alega que existe una vía institucional que debe seguirse para la obtención de tales informaciones. “Para obtener un acceso más directo, se necesita enviarle una solicitud al CNPq explicando los motivos por los cuales el investigador necesita los datos del Lattes”, afirma.
Republicar