{"id":555157,"date":"2025-06-30T16:15:55","date_gmt":"2025-06-30T19:15:55","guid":{"rendered":"https:\/\/revistapesquisa.fapesp.br\/?p=555157"},"modified":"2025-07-02T09:31:22","modified_gmt":"2025-07-02T12:31:22","slug":"graca-nunes-ia-sin-espejismos","status":"publish","type":"post","link":"https:\/\/revistapesquisa.fapesp.br\/es\/graca-nunes-ia-sin-espejismos\/","title":{"rendered":"Gra\u00e7a Nunes: IA sin espejismos"},"content":{"rendered":"<p>Al marcar presencia en el \u00e1rea de la ciencia de la computaci\u00f3n desde la d\u00e9cada de 1980 como docente e investigadora, Maria das Gra\u00e7as Volpe Nunes sabe lo que los programas de inteligencia artificial (IA) m\u00e1s recientes pueden o no hacer, m\u00e1s all\u00e1 de las exageraciones con las que se los presenta. En la siguiente entrevista, concedida a trav\u00e9s de una plataforma de video, ella expone los equ\u00edvocos m\u00e1s comunes relacionados con esta \u00e1rea, como el de suponer que la m\u00e1quina entiende lo que le preguntamos, cuando a decir verdad tan solo proporciona las secuencias de vocablos m\u00e1s probables para acompa\u00f1ar a las palabras que se le plantearon.<\/p>\n<p>Tambi\u00e9n advierte sobre la falta de cuestionamiento al respecto del alcance y de los eventuales errores de estos programas. \u201cSi algo sale mal, a qui\u00e9n deber\u00eda culparse: \u00bfa la m\u00e1quina, al programador o a la persona que le proporcion\u00f3 informaci\u00f3n a la m\u00e1quina?\u201d, se pregunta Nunes, de 65 a\u00f1os, quien con una carrera hecha en el Instituto de Ciencias Matem\u00e1ticas y Computaci\u00f3n de la Universidad de S\u00e3o Paulo (ICMC-USP), en la ciudad paulista de S\u00e3o Carlos, y actualmente jubilada, sigue trabajando en la instituci\u00f3n como profesora s\u00e9nior.<\/p>\n<div class=\"box-lateral\"><strong>Especialidad<br \/>\n<\/strong>Procesamiento del lenguaje natural (PLN)<br \/>\n<strong>Instituci\u00f3n<br \/>\n<\/strong>Instituto de Ciencias Matem\u00e1ticas y Computaci\u00f3n de la Universidad de S\u00e3o Paulo (ICMC-USP)<br \/>\n<strong>Estudios<br \/>\n<\/strong>T\u00edtulo de grado en ciencias de la computaci\u00f3n por la Universidad Federal de S\u00e3o Carlos (UFSCar, 1980), maestr\u00eda en ciencias de la computaci\u00f3n por la Universidad de S\u00e3o Paulo (USP, 1985) y doctorado en inform\u00e1tica por la Pontificia Universidad Cat\u00f3lica de R\u00edo de Janeiro (PUC-RJ, 1991)<\/div>\n<p>La investigadora se especializ\u00f3 en un \u00e1rea de la IA, el procesamiento de lenguaje natural (PLN), que investiga la construcci\u00f3n de sistemas que procesan el lenguaje humano, ya sea escrito o hablado. Fue la coordinadora del grupo que, en la d\u00e9cada de 1990, desarroll\u00f3 el Corrector Gramatical Autom\u00e1tico para Portugu\u00e9s, un proyecto pionero en Brasil ejecutado en colaboraci\u00f3n con el entonces fabricante de computadoras Itautec-Philco y apoyado por la FAPESP. El corrector fue incorporado por Microsoft al procesador de textos de Windows, disponible para los consumidores brasile\u00f1os.<\/p>\n<p>Est\u00e1 casada con el matem\u00e1tico Wagner Vieira Leite Nunes, profesor jubilado del ICMC-USP, y tienen un hijo psic\u00f3logo \u2012Bruno\u2012 de 30 a\u00f1os. Tambi\u00e9n escribe cr\u00f3nicas y cuentos, archivados en un sitio web, bajo el seud\u00f3nimo de Anel\u00ea Volpe.<\/p>\n<p><strong>A usted se la conoce sobre todo por el corrector o revisor gramatical en portugu\u00e9s que su grupo cre\u00f3 en la d\u00e9cada de 1990. \u00bfQu\u00e9 han hecho despu\u00e9s de eso?<br \/>\n<\/strong>Hemos hecho muchas cosas. Soy una investigadora de la inteligencia artificial en un campo muy concreto, el procesamiento de lenguaje natural, que estudia la construcci\u00f3n de sistemas que procesan el lenguaje humano, ya sea escrito u oral. Lo llamamos lenguaje natural para diferenciarlo de otros tipos de lenguaje, tales como el de programaci\u00f3n, el lenguaje gr\u00e1fico y el matem\u00e1tico, entre otros. Estos sistemas pueden revisar y corregir textos, traducir de un idioma a otro \u2012los llamados traductores autom\u00e1ticos\u2012, resumir o simplificar un texto, responder preguntas \u2012los chatbots\u2012, analizar la coherencia de un texto y su adecuaci\u00f3n a un objetivo determinado. Por su complejidad, el proyecto del revisor gramatical del ICMC-USP llev\u00f3 a la creaci\u00f3n del Nilc, el N\u00facleo Interinstitucional de Ling\u00fc\u00edstica Computacional, que form\u00f3 a una gran cantidad de ling\u00fcistas computacionales, hoy en d\u00eda desperdigados por universidades brasile\u00f1as e internacionales. Ese equipo estuvo a cargo de la creaci\u00f3n de los importantes recursos necesarios para el procesamiento del portugu\u00e9s brasile\u00f1o.<\/p>\n<p><strong>\u00bfCu\u00e1les eran esos recursos?<br \/>\n<\/strong>Hablamos de diccionarios, l\u00e9xicos, programas, en definitiva, los recursos ling\u00fc\u00edsticos computacionales que necesit\u00e1bamos para procesar la lengua portuguesa que hasta entonces no exist\u00edan. Nuestro grupo se hizo conocido y se convirti\u00f3 en un aglutinador de personas trabajando por todo Brasil. Concretamos varias colaboraciones, convenios y proyectos. A partir de ello, tambi\u00e9n se fortalecieron otros equipos de investigadores. Hoy en d\u00eda existen grupos de PLN muy activos en pr\u00e1cticamente todas las universidades y centros de ense\u00f1anza de Brasil. Desde 1993, la comunidad de PLN en portugu\u00e9s organiza cada dos a\u00f1os la conferencia Propor [<em>International Conference on Computational Processing of Portuguese Language<\/em>]. Se celebra alternativamente en Brasil y Portugal para presentar los resultados de investigaciones acad\u00e9micas y tecnol\u00f3gicas e integrar a los grupos de investigaci\u00f3n del \u00e1rea. La \u00faltima se llev\u00f3 a cabo en marzo en Galicia (Espa\u00f1a), ya que muchos consideran que el gallego y el portugu\u00e9s son variantes de un mismo idioma.<\/p>\n<p><strong>\u00bfQu\u00e9 llevan hecho en conjunto con portugueses y espa\u00f1oles?<br \/>\n<\/strong>Con los portugueses mantenemos un contacto fluido, con el Propor como principal iniciativa. Con los espa\u00f1oles las relaciones se concretan a trav\u00e9s de proyectos de cooperaci\u00f3n cient\u00edfica e intercambio de estudiantes. A finales de la d\u00e9cada de 1990 tuvimos un proyecto de traducci\u00f3n conjunto con la Universidad de Alicante. Este es un tema con el trabajamos desde hace mucho tiempo. Por la misma \u00e9poca, nos sumamos a un gran proyecto de traducci\u00f3n autom\u00e1tica multiling\u00fce de la Universidad de las Naciones Unidas con representantes de cada idioma de la ONU. A diferencia de lo que ocurre en la actualidad, en aquella \u00e9poca los sistemas de traducci\u00f3n se hac\u00eda para cada par de lenguas. Ese proyecto, que consideraba la existencia de un lenguaje l\u00f3gico intermedio, el UNL [<em>Universal Networking Language<\/em>], preve\u00eda un decodificador y un codificador UNL para cada lengua natural. As\u00ed, cada equipo responsable de una lengua ten\u00eda que desarrollar solamente esos dos sistemas para su idioma. Una vez disponibles todos esos pares, cualquiera pod\u00eda traducir archivos de texto en cualquier idioma al propio y viceversa. Nosotros, en el Nilc, nos hicimos cargo del decodificador y el codificador del idioma portugu\u00e9s.<\/p>\n<blockquote><p>Nuestro grupo de la USP se hizo conocido y se convirti\u00f3 en un aglutinador de gente diseminada por todo el pa\u00eds<\/p><\/blockquote>\n<p><strong>\u00bfFuncion\u00f3?<br \/>\n<\/strong>No. Por dos razones. Una de ellas t\u00e9cnica: para que este lenguaje intermedio fuera realmente bueno tendr\u00eda que ser universal, capaz de abarcar los significados de todas las lenguas. Como de alguna manera deb\u00eda materializarse, eligieron el ingl\u00e9s. Se supon\u00eda que los t\u00e9rminos en ingl\u00e9s pod\u00edan representar de forma un\u00edvoca todos los conceptos de todos los idiomas, pero esto no es as\u00ed. La otra limitaci\u00f3n fue pol\u00edtica. Cada equipo \u2012y hab\u00eda decenas\u2012 defend\u00eda su punto de vista y no se llegaba a ning\u00fan acuerdo. No funcion\u00f3, pero desde el punto de vista del PLN aprendimos mucho y armamos varios proyectos de maestr\u00eda y doctorado en el Nilc utilizando recursos de traducci\u00f3n autom\u00e1tica. Poco despu\u00e9s, la tecnolog\u00eda de aprendizaje autom\u00e1tico [programas que aprenden a partir de datos] domin\u00f3 este campo y dio lugar a traductores autom\u00e1ticos muy superiores, como Google Traductor.<\/p>\n<p><strong>Adem\u00e1s del corrector, \u00bfsu grupo lanz\u00f3 alg\u00fan otro producto comercial?<br \/>\n<\/strong>No directamente. Aunque el Nilc naci\u00f3 como un generador de productos, no tiene ese objetivo. Lo que m\u00e1s nos importa es el avance del conocimiento. El n\u00facleo es un centro de investigaci\u00f3n y construcci\u00f3n de recursos b\u00e1sicos para el procesamiento del portugu\u00e9s, que incluye analizadores sint\u00e1cticos, sem\u00e1nticos y diccionarios, que constituyen la base del conocimiento ling\u00fc\u00edstico. Brindamos acceso irrestricto a todo lo que hemos hecho. Las aplicaciones desarrolladas en el \u00e1mbito acad\u00e9mico suelen ser prototipos para demostrar las ideas propuestas. Los productos comerciales son fruto de proyectos en asociaci\u00f3n con empresas, como es el caso del corrector o revisor, que cont\u00f3 con el apoyo de Itautec. Hoy en d\u00eda es m\u00e1s com\u00fan que las empresas inviertan en los grupos acad\u00e9micos en un primer momento y despu\u00e9s, sus equipos internos completan el trabajo desarrollado en la academia. Entre los proyectos ya realizados y en curso, algunos prototipos incluyen resumidores autom\u00e1ticos [herramientas que elaboran res\u00famenes de noticias o de documentos diversos] y sistemas que simplifican textos para adaptar el lenguaje a ni\u00f1os o adultos poco letrados. Tambi\u00e9n existen herramientas que detectan <em>fake news<\/em>, ayudan a redactar textos cient\u00edficos y realizan transcripciones de audios, entre otras.<\/p>\n<p><strong>\u00bfA qu\u00e9 atribuye los desarrollos recientes en IA?<br \/>\n<\/strong>En primer lugar, al avance de la capacidad computacional. Hoy en d\u00eda las computadoras son mucho m\u00e1s veloces y pueden combinarse para aumentar su poder. Y en segundo orden a la computaci\u00f3n en la nube, que ampl\u00eda la capacidad de c\u00f3mputo para muchas m\u00e1s personas. Esta alta capacidad de procesamiento hizo posible que antiguos modelos de inteligencia artificial, las redes neuronales artificiales [RNA], pudiesen demostrar su potencial real. Las RNA son modelos matem\u00e1ticos de procesamiento inspirados en el funcionamiento del cerebro humano. Son programas compuestos por capas de procesamiento capaces de promover el aprendizaje de un concepto determinado a partir de muchos ejemplos del concepto en cuesti\u00f3n. La cantidad de datos que se proporcionan para que el programa aprenda es muy importante para el resultado final, as\u00ed como la estructura de la red neuronal. Estos modelos existen desde hace mucho tiempo, pero requer\u00edan muchos datos y un gran poder computacional, del que solo ahora disponemos. Adem\u00e1s, el modelo de aprendizaje profundo [<em>deep learning<\/em>] ha revolucionado este campo con resultados muy expresivos.<\/p>\n<p><strong>\u00bfTodo el mundo tiene acceso a estas tecnolog\u00edas?<br \/>\n<\/strong>Hablemos del PLN. Los grandes modelos de lenguaje [LLM, en ingl\u00e9s], que se entrenan a partir de inmensos vol\u00famenes de datos y de par\u00e1metros, representan la lengua en la que fueron entrenados. De este modo, son capaces de generar textos con una calidad comparable a la de los humanos, y a veces incluso superior. Si bien es posible conversar naturalmente con un chatbot basado en LLM, como Chat-GPT, \u00e9ste no comprende el idioma. Esta \u201cmagia\u201d acontece debido a un complejo sistema de capas de pesos num\u00e9ricos. El hecho es que en la actualidad, casi todos los problemas de PLN e IA pueden resolverse mediante LLM con un rendimiento muy superior al de los sistemas anteriores. Pero la construcci\u00f3n de estos modelos es muy costosa porque requieren muchos datos, mucha gente para procesarlos, servidores muy potentes y que consumen mucha energ\u00eda. Tan solo las grandes multinacionales tecnol\u00f3gicas, las <em>big techs<\/em>, poseen esta capacidad. Para tener acceso a estos modelos hay que pagar por su mejor versi\u00f3n, o bien utilizar una m\u00e1s limitada. O incluso se pueden alquilar servidores en la nube para entrenar tu propio modelo, lo que es muy caro. En cualquier caso, todo el mundo est\u00e1 a merced de quienes disponen de esta tecnolog\u00eda. En gran medida, se ha perdido el control sobre los que estos sistemas hacen. Incluso la informaci\u00f3n ling\u00fc\u00edstica cl\u00e1sica, como la ortograf\u00eda, la gram\u00e1tica y el significado de las palabras, entre otras, ya no son tan necesarias. Este es un gran punto de ruptura para el PLN. Estamos a un paso de tirar por la borda todo lo que hemos hecho hasta ahora para confiar \u00fanicamente en los LLM y seguir adelante.<\/p>\n<blockquote><p>La gente que trabaja en sistemas basados en inteligencia artificial deber\u00eda asumir un compromiso \u00e9tico<\/p><\/blockquote>\n<p><strong>\u00bfHace falta ser m\u00e1s cr\u00edticos con respecto al uso de la IA?<br \/>\n<\/strong><span lang=\"es-419\">S\u00ed. Las personas que trabajan con IA tendr\u00edan que asumir otro tipo de compromiso \u00e9tico, pero no estoy segura de que tengan noci\u00f3n del alcance de sus decisiones<\/span>. \u00bfSer\u00e1 que apelan a su discernimiento al seleccionar los datos, previendo el impacto de sus decisiones? Creo que no. Las <em>big techs<\/em> contratan mucha gente en el mundo subdesarrollado para recopilar conjuntos de datos y entrenar sus programas. Las personas que trabajan con esos datos desconocen el prop\u00f3sito de aquello con lo que est\u00e1n trabajando. En el \u00e1mbito acad\u00e9mico, no veo que haya una actitud de cambio del comportamiento para llamar la atenci\u00f3n sobre esto. Es nuestro deber cuestionarlo. Del mismo modo que debemos dar a conocer c\u00f3mo la IA puede ayudar a solucionar diversos problemas de la sociedad \u2012en la medicina, en la agricultura, en la seguridad p\u00fablica, en el bienestar\u2012, tenemos la obligaci\u00f3n de advertir sobre sus l\u00edmites y riesgos potenciales. Si bien no tenemos respuestas para todo, y no sabemos c\u00f3mo mitigar estos problemas, al menos podemos alertar a la sociedad para que ella misma tome las medidas que quepa tomar. Es lo que hemos visto hacer a varios organismos gubernamentales en todo el mundo.<\/p>\n<p><strong>\u00bfDe ah\u00ed viene la necesidad de regular el uso de la IA?<br \/>\n<\/strong>Exacto. Tenemos que establecer regulaciones, como se est\u00e1 debatiendo en Brasil y en otros pa\u00edses (<a href=\"https:\/\/revistapesquisa.fapesp.br\/es\/desafios-a-la-hora-de-regular-el-uso-de-la-inteligencia-artificial\/\" target=\"_blank\" rel=\"noopener\"><em>lea en <\/em>Pesquisa FAPESP<em>, edici\u00f3n n\u00ba 331<\/em><\/a>), porque los modelos de IA generativa, entre ellos ChatGPT, tienen puntos de sombras. El principal es que los programas no son explicables. Ni siquiera los que hacen los programas saben exactamente lo que ocurre en su interior, porque son millones de combinaciones de cifras y funciones. Tampoco puede decirse c\u00f3mo surgen los errores ni qui\u00e9n los ocasion\u00f3. Si algo sale mal, \u00bfa qui\u00e9n hay que responsabilizar: a la m\u00e1quina, al programador o a quien carg\u00f3 informaci\u00f3n en la m\u00e1quina? \u00bfY qu\u00e9 se puede hacer para corregirlos? No lo sabemos, porque estos programas no son explicativos. Es por ello que se dice que la IA generativa no es transparente. La empresa responsable debe explicarles a sus clientes c\u00f3mo funcionan detalladamente, qu\u00e9 resultados pueden esperarse de ellos y en qu\u00e9 situaciones pueden llegar a fallar. Pero esto no ocurre. Hoy en d\u00eda, muchos de los que forman parte de la comunidad de la IA estudian formas de mitigar estas deficiencias.<\/p>\n<p><strong>\u00bfEllo se debe a la forma en que se construyen los programas?<br \/>\n<\/strong>As\u00ed es, se debe al modelo de las redes neuronales profundas, a los modelos de lenguaje, etc. Necesitamos normativas porque estos sistemas plantean un riesgo enorme de generar resultados imprevisibles y potencialmente da\u00f1inos. El problema es que la gente ya est\u00e1 utilizando estas tecnolog\u00edas sin que existan reglas que definan qu\u00e9 hay que hacer para lidiar con eventuales consecuencias indeseables. Vean lo que ocurre en el caso del entrenamiento de modelos de lenguaje con datos tomados de las redes sociales. Por la propia naturaleza de las redes, el material ling\u00fc\u00edstico que se utiliza para entrenar el modelo puede estar contaminado por expresiones racistas, xen\u00f3fobas, homof\u00f3bicas y otros valores indeseables, cuya propagaci\u00f3n resulta nociva. Debemos ser muy cuidadosos. Pero no lo estamos siendo.<\/p>\n<p><strong>\u00bfCu\u00e1les son actualmente los grandes retos del PLN?<br \/>\n<\/strong>Parad\u00f3jicamente, el \u00e9xito repentino de la tecnolog\u00eda de los LLM se ha convertido en un reto para el sector. \u00bfC\u00f3mo puede adoptarse un modelo poco transparente y escasamente manejable para resolver todo tipo de problemas? Pero existen otros. Uno de los mayores desaf\u00edos es el tratamiento computacional de la sem\u00e1ntica de la lengua natural, es decir, lograr que un sistema sea capaz de elegir el sentido correcto expresado en una oraci\u00f3n o en un texto. La m\u00e1quina entiende muy bien el formato de una lengua. Le ense\u00f1amos lo que es una palabra, c\u00f3mo articular frases gramaticalmente correctas, porque expresamos racionalmente la morfolog\u00eda y la gram\u00e1tica. No ocurre as\u00ed en el caso del sentido, porque no existen reglas formales lo definan, que definan el significado. Los LLM parecen resolver el problema del significado, pero es una impresi\u00f3n err\u00f3nea. Los modelos de lenguaje son programas que reconocen billones de palabras en su contexto, como las frases, y acaban \u201caprendiendo\u201d esa lengua. Si uno les pregunta: \u201cHoy tengo fr\u00edo, \u00bfqu\u00e9 me sugieres usar?\u201d, el sistema responder\u00e1 algo as\u00ed como: \u201cLe sugiero un pul\u00f3ver\u201d. Da la impresi\u00f3n de que ha entendido la pregunta.<\/p>\n<div id=\"attachment_555162\" style=\"max-width: 1150px\" class=\"wp-caption alignright vertical\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-555162 size-full\" src=\"https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2025\/06\/RPF-entr-evista-graca-nunes-disquetes-2024-11-1140.jpg\" alt=\"\" width=\"1140\" height=\"757\" srcset=\"https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2025\/06\/RPF-entr-evista-graca-nunes-disquetes-2024-11-1140.jpg 1140w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2025\/06\/RPF-entr-evista-graca-nunes-disquetes-2024-11-1140-250x166.jpg 250w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2025\/06\/RPF-entr-evista-graca-nunes-disquetes-2024-11-1140-700x465.jpg 700w, https:\/\/revistapesquisa.fapesp.br\/wp-content\/uploads\/2025\/06\/RPF-entr-evista-graca-nunes-disquetes-2024-11-1140-120x80.jpg 120w\" sizes=\"auto, (max-width: 1140px) 100vw, 1140px\" \/><p class=\"wp-caption-text\"><span class=\"media-credits-inline\">Archivo Personal  <\/span>Tarjetas perforadas y disquetes utilizados en los albores de la computaci\u00f3n<span class=\"media-credits\">Archivo Personal  <\/span><\/p><\/div>\n<p><strong>\u00bfNo es as\u00ed?<br \/>\n<\/strong>Es una ilusi\u00f3n. La m\u00e1quina ha recibido tanta informaci\u00f3n que tan solo proporciona la frase m\u00e1s probable que aparece tras una serie de palabras planteada que, para el internauta, es una pregunta. El programa no tiene la menor idea de que se trata de una pregunta, porque solamente opera con series o secuencias de palabras. Somos nosotros quienes le damos sentido a lo que se ha expresado, consider\u00e1ndolo una respuesta adecuada a la pregunta. Nosotros tampoco sabemos c\u00f3mo opera nuestra comprensi\u00f3n de las cosas, c\u00f3mo adjudicamos un significado a las palabras y a las cosas. \u00bfC\u00f3mo podemos esperar construir una m\u00e1quina que haga lo que ni siquiera nosotros sabemos? Hay otros problemas. Al igual que con cualquier sistema de IA, los resultados del PLN no son exactos, siempre se trata de aproximaciones a las soluciones ideales. La traducci\u00f3n autom\u00e1tica es muy buena, pero no perfecta; un resumidor autom\u00e1tico puede ser muy \u00fatil, pero no es perfecto. Tenemos que analizar los problemas \u00e9ticos y los errores de los programas mientras los construimos, no despu\u00e9s. Si el algoritmo presenta una situaci\u00f3n de riesgo, debemos evitarla y corregirla. En lugar de tratar de hallar la soluci\u00f3n \u00f3ptima a toda costa, \u00bfqu\u00e9 tal si nos quedamos con la mejor soluci\u00f3n que evite riesgos y da\u00f1os?<\/p>\n<p><strong>\u00bfC\u00f3mo podemos minimizar estos problemas?<br \/>\n<\/strong>Lo que podemos hacer es mostrar el conocimiento que tenemos y aclarar c\u00f3mo es que suceden estas cosas. Esto es de lo que se est\u00e1 ocupando el grupo Brasileiras em PLN, del que formo parte y que ya cuenta con 211 miembros. En 2023 publicamos el libro <em>Processamento de linguagem natural: Conceitos, t\u00e9cnicas e aplica\u00e7\u00f5es em portugu\u00eas<\/em>. Se trata de una edici\u00f3n en l\u00ednea y gratuita. Hasta entonces, no hab\u00eda un manual tan completo sobre PLN en idioma portugu\u00e9s. Las compiladoras del libro, que tiene m\u00e1s de 60 autores, somos Helena Caselli, de la UFSCar, y yo. Queremos mantenerlo actualizado permanentemente y mostrar lo que hay detr\u00e1s de los sistemas de PLN que funcionan en idioma portugu\u00e9s. En noviembre publicaremos la tercera edici\u00f3n ampliada y actualizada.<\/p>\n<p><strong>\u00bfExisten otras iniciativas?<br \/>\n<\/strong>Desde que creamos el Nilc hemos ido creando m\u00e1s recursos para el portugu\u00e9s, como un gran corpus [colecciones de documentos] para entrenar el LLM, pero que sea lo suficientemente completo y variado como para ser representativo de la lengua que pretendemos modelar. Hay grupos de investigaci\u00f3n como el Centro de Inteligencia Artificial, financiado por la FAPESP y por IBM, en el que participo, que hacen lo mismo. Pero todo esto demanda tiempo, dinero y recursos humanos. A finales de 2022, el mundo fue sacudido por una <em>startup<\/em>, Open AI, que lanz\u00f3 ChatGPT, un chatbot que utiliza modelos de lenguas naturales, incluyendo el portugu\u00e9s. Veo un ansia muy grande por producir sistemas r\u00e1pidamente, porque estos nuevos modelos lo permiten. Estos programas pueden utilizarse en las escuelas, pueden usarlos ni\u00f1os, aunque no han sido probados fehacientemente. El ChatGPT es un ejemplo. Cuando apareci\u00f3, parec\u00eda ser algo maravilloso, pero pocos d\u00edas despu\u00e9s todos advirtieron que produc\u00eda mucha informaci\u00f3n falsa.<\/p>\n<p><strong>\u00bfPor qu\u00e9 se interes\u00f3 por la programaci\u00f3n?<br \/>\n<\/strong>Yo soy de Sert\u00e3ozinho, una ciudad paulista cercana a Ribeir\u00e3o Preto, y vine a S\u00e3o Carlos a mediados de la d\u00e9cada de 1970 para cursar la carrera de biblioteconom\u00eda. Me encantaban los libros, aunque en aquella \u00e9poca no era consciente de ello. Pero solamente curs\u00e9 seis meses. Necesitaba en reto mayor que \u00e9se. Como ya estaba aqu\u00ed, evalu\u00e9 las carreras que hab\u00eda en las dos universidades, la UFSCar y la USP. Resolv\u00ed estudiar la carrera de computaci\u00f3n en la universidad federal, que entonces era considerada la profesi\u00f3n del futuro, aunque yo no ten\u00eda la menor idea de qu\u00e9 se trataba. De hecho, en el primer a\u00f1o de cursada, en 1977, no ten\u00edamos contacto con computadoras. Solamente hab\u00eda una minicomputadora, que de mini solo ten\u00eda el nombre, ya que se trataba de una m\u00e1quina enorme. Estaba instalada en una gran sala refrigerada, donde una persona manipulaba las tarjetas y las cintas perforadas que codificaban los programas.<\/p>\n<blockquote><p>Antes, la cantidad de muchachos y chicas en el \u00e1rea de la computaci\u00f3n era similar. Hoy en d\u00eda, el n\u00famero de mujeres ha disminuido bastante<\/p><\/blockquote>\n<p><strong>\u00bfQu\u00e9 estudi\u00f3 en su maestr\u00eda y en su doctorado?<br \/>\n<\/strong>Comenc\u00e9 la maestr\u00eda en la USP en un \u00e1rea llamada an\u00e1lisis de algoritmos bajo la direcci\u00f3n de la profesora Maria Carolina Monard [1941-2022]. En mis estudios comparaba qu\u00e9 algoritmo realizaba la mejor b\u00fasqueda de palabras en archivos de texto, mucho antes de que existieran internet, Google y otras herramientas de b\u00fasqueda. Mi doctorado lo realic\u00e9 en la PUC-RJ bajo la direcci\u00f3n del cient\u00edfico de la computaci\u00f3n Tarc\u00edsio Pequeno, que en aquella \u00e9poca trabajaba con la teor\u00eda de la computaci\u00f3n. All\u00ed conoc\u00ed a dos profesoras, Clarice Sieckenius de Souza y la jamaiquina Donia Scott, de la Universidad de Brighton, en Inglaterra, quien estaba all\u00ed durante un a\u00f1o sab\u00e1tico. Empec\u00e9 a trabajar en PLN con ellas. Complet\u00e9 el doctorado, regres\u00e9 a la USP de S\u00e3o Carlos, donde ya cumpl\u00eda tareas docentes y enseguida arrancamos con el proyecto del corrector gramatical. Desde entonces me dediqu\u00e9 por entero al \u00e1rea del PLN y me qued\u00e9 definitivamente trabajando en este campo.<\/p>\n<p><strong>\u00bfQu\u00e9 tan importante fue Monard para la IA brasile\u00f1a?<br \/>\n<\/strong>Fue una pionera de las investigaciones en IA en el pa\u00eds. Como profesora titular del Departamento de Ciencias de la Computaci\u00f3n del ICMC-USP, dirigi\u00f3 a una gran cantidad de investigadores desde la d\u00e9cada de 1980 en adelante. Sus investigaciones siempre fueron de alta calidad y lider\u00f3 el \u00e1rea del aprendizaje autom\u00e1tico, responsable del gran avance de la inteligencia artificial. En ambientes predominantemente masculinos, como toda el \u00e1rea de las ciencias exactas y las profesiones tecnol\u00f3gicas, Monard fue un ejemplo para muchas j\u00f3venes. Por desgracia, la cantidad de mujeres que optan por dedicarse a la inform\u00e1tica ha descendido mucho en las \u00faltimas d\u00e9cadas. En mi \u00e9poca de estudiante en la UFSCar, en la tercera promoci\u00f3n de la carrera de ciencias de la computaci\u00f3n, la cifra de chicos y chicas era pr\u00e1cticamente la misma. A medida que la sociedad se ha ido informatizando y las profesiones de computaci\u00f3n se han ido popularizando \u2012y no es que esto sea una causa\u2012, el n\u00famero de mujeres del \u00e1rea ha disminuido bastante. No obstante, veo que ahora hay varios movimientos por la inclusi\u00f3n femenina en las ciencias exactas en general y en la computaci\u00f3n en particular. Supongo que estos intereses van variando de tanto en tanto, dependiendo de factores que van m\u00e1s all\u00e1 de las aptitudes de cada individuo. Sea como sea, la amplia difusi\u00f3n del \u00e1rea, la ca\u00edda de los prejuicios de g\u00e9nero y los ejemplos de mujeres que ocupan puestos de liderazgo son instrumentos eficaces para revertir este panorama.<\/p>\n<p><strong>\u00bfPor qu\u00e9 se jubil\u00f3 en 2013, con menos de 60 a\u00f1os?<br \/>\n<\/strong>Solicit\u00e9 la jubilaci\u00f3n porque ya hab\u00eda cumplido el tiempo requerido. Consider\u00e9 que ya hab\u00eda contribuido lo suficiente. Fui coordinadora de la licenciatura en computaci\u00f3n y del programa de posgrado, particip\u00e9 en todas las comisiones posibles e imaginables. Llegu\u00e9 a la conclusi\u00f3n de que ya no me necesitaban y que en el aula, los alumnos sacar\u00edan mejor partido de docentes m\u00e1s j\u00f3venes, con doctorados m\u00e1s recientes, ya que en las \u00e1reas tecnol\u00f3gicas es muy importante la actualizaci\u00f3n permanente de conocimientos. Nuestro grupo de investigaci\u00f3n, el Nilc, estaba muy bien administrado por el profesor Thiago Pardo, quien fue alumno m\u00edo de doctorado. Tampoco me necesitaban m\u00e1s all\u00ed.<\/p>\n<p><strong>Se jubil\u00f3, pero no se retir\u00f3 del todo, \u00bfverdad?<br \/>\n<\/strong>Sigo trabajando en la USP como profesora s\u00e9nior. Eventualmente doy algunas clases y sigo de cerca los trabajos del Nilc. Uno de ellos es Poetisa, un proyecto que aglutina a varios grupos para la construcci\u00f3n del corpus del portugu\u00e9s oral y escrito en Brasil. Entre otras cosas, estos textos sirven para entrenar algoritmos que hacen an\u00e1lisis sint\u00e1ctico [<em>parsing<\/em>], una tarea importante para la mayor\u00eda de las aplicaciones de PLN. Existen varios <em>parsers<\/em> de portugu\u00e9s, pero a\u00fan es posible mejorarlos. Es un trabajo que llevar\u00e1 muchos a\u00f1os. Otro de los proyectos del grupo trata del procesamiento del habla, coordinado por la profesora Sandra Alu\u00edsio, tambi\u00e9n del ICMC-USP. Pretendemos crear transcripciones del lenguaje hablado a partir de audios, con muestras representativas de Brasil, para luego utilizarlas en aplicaciones que usar\u00e1n audio en portugu\u00e9s.<\/p>\n<p><strong>\u00bfCu\u00e1ndo comenz\u00f3 su carrera como escritora?<br \/>\n<\/strong>Es un viejo anhelo, pero quiz\u00e1 antes no lo dejaba traslucir. Hoy en d\u00eda reconozco que si no hubiera sido profesora me hubiera encantado ser escritora. Empec\u00e9 a escribir en 2005, antes de jubilarme. Redact\u00e9 algunas cr\u00f3nicas, me gustaron y decid\u00ed continuar. En 2007 descubr\u00ed una aplicaci\u00f3n llamada 700 palabras. Te ped\u00eda que escribieras 700 palabras por d\u00eda durante 30 d\u00edas. Acept\u00e9 el reto y escrib\u00ed una cr\u00f3nica diaria durante un mes. Fue muy divertido. Ahora tengo una p\u00e1gina web que mont\u00e9 al principio de la pandemia, con todo lo que hab\u00eda escrito. No quer\u00eda publicar un libro porque eran temas muy personales y adem\u00e1s me daba mucha verg\u00fcenza, pero en un sitio web y bajo el seud\u00f3nimo de Anel\u00ea Volpe me siento m\u00e1s libre. Incluso he publicado un libro sobre mi historia familiar, para regal\u00e1rselo a mis parientes.<\/p>\n","protected":false},"excerpt":{"rendered":"La experta brasile\u00f1a de la USP de S\u00e3o Carlos alerta sobre los l\u00edmites e impedimentos \u00e9ticos de los programas de inteligencia artificial","protected":false},"author":17,"featured_media":555158,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[183,192],"tags":[288],"coauthors":[5968,116],"class_list":["post-555157","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-entrevista-es","category-tecnologia-es","tag-computacion","position_at_home-sumario"],"acf":[],"_links":{"self":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/555157","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/users\/17"}],"replies":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/comments?post=555157"}],"version-history":[{"count":3,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/555157\/revisions"}],"predecessor-version":[{"id":556132,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/posts\/555157\/revisions\/556132"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/media\/555158"}],"wp:attachment":[{"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/media?parent=555157"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/categories?post=555157"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/tags?post=555157"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/revistapesquisa.fapesp.br\/es\/wp-json\/wp\/v2\/coauthors?post=555157"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}