Imprimir Republish

Computación

Aprendizaje inteligente

Una máquina absorbe conocimiento en forma continua

GABRIEL BITAR y NANA LAHOZNo es de ahora que la idea de la existencia de computadoras inteligentes, capaces de razonar, aprender y tomar decisiones de manera autónoma suscita la curiosidad y es retratada en la ficción. La más famosa de esas máquinas es sin dudas HAL 9000, personaje dotado de una avanzada inteligencia artificial inmortalizado en el film 2001: odisea del espacio, dirigido por Stanley Kubrick en 1968. Pero, ¿será que algún día esas máquinas podrán salir del universo de la ficción y convertirse en realidad? Varios científicos de todo el mundo intentan dar respuesta a esta pregunta con proyectos destinados a que los ordenadores se vuelvan más inteligentes. Uno de ellos es el Read the Web –o lectura en la web–, un programa desarrollado en colaboración por investigadores de la Universidad Federal de São Carlos (UFSCar) y de la Universidad Carnegie Mellon, de Estados Unidos. El grupo desarrolla una computadora capaz de aprender de manera autónoma y de utilizar los conocimientos adquiridos para evolucionar en su propio aprendizaje. El problema planteado consiste en crear una máquina que lea páginas de la web y, partiendo de tal lectura, mejore su capacidad de aprendizaje de manera continua.

“Pretendemos demostrar que con el actual desarrollo de las técnicas de aprendizaje de máquinas, recuperación de información y procesamiento de lenguaje es posible construir una computadora ‘inteligente’ y con capacidad para adquirir más y más conocimientos, exactamente como lo hacemos nosotros”, explica el profesor Estevam Rafael Hruschka Junior, del Departamento de Computación de la UFSCar, coordinador brasileño de la iniciativa. Para alcanzar este objetivo, el equipo construyó un programa de computadora bautizado NELL (iniciales de never-ending language learner), que apunta a un nuevo patrón de aprendizaje de máquina llamado “aprendizaje sin fin”. “Es un nuevo paradigma. El ordenador aprende continuamente y no solamente un tipo de conocimiento específico, sino también conocimientos generales y del sentido común que lo ayudarán a ampliar su capacidad de aprendizaje con el correr del tiempo”, explica Hruschka.

Un aspecto importante del aprendizaje sin fin es la acumulación de experiencias. Así como los seres humanos aprendemos conceptos más complejos luego de adquirir conocimientos más básicos y simples –es más fácil aprender álgebra después de haber aprendido las operaciones aritméticas básicas–, NELL se vale de su experiencia acumulada durante el proceso de aprendizaje posterior. “De la misma manera que un empleado más antiguo en una empresa detecta situaciones que pueden llevar a equívocos y evitarlas, con el correr del tiempo, NELL detecta estrategias infructuosas de aprendizaje y puede alterarlas a los efectos de perfeccionar el proceso”, comenta el investigador.

Pero, ¿cómo se lleva a cabo el proceso de aprendizaje de NELL? Al comienzo recibe informaciones que definen cuál ha de ser su foco específico de aprendizaje. “Insertamos en NELL, bajo la forma de archivos de entrada, los conceptos que estamos interesados en que aprenda y qué relaciones entre esos conceptos nos importan”, explica Hruschka. A partir de allí, el programa comienza a “leer” archivos de internet para extraer conocimiento de temas específicos. Para entender cómo funciona este aprendizaje, Hroschlka comenta de qué modo aprende NELL el nombre de las ciudades del mundo. “De entrada le suministramos a la computadora algunas sugerencias de lectura que la ayudarán a detectar ciudades en los términos hallados en internet. Podemos decirle que siempre que encuentre la sentencia ‘x es una ciudad ubicada…’, donde el término x se refiere a una ciudad. Al cabo de la lectura y la identificación de algunas ciudades, NELL está en condiciones de definir autónomamente nuevas formas de identificación de ciudades, valiéndose de la sentencia ‘el Ayuntamiento de x’, por ejemplo.”

En general, NELL aprende hechos que constituyen la relación entre dos categorías, tales como “yo vivo en… (ciudad, país, etc.)” o “él juega en… (equipo de voleibol, fútbol)”. En total, la computadora domina hasta ahora 280 tipos de relaciones, y esa cifra crece continuamente. Para evitar el aprendizaje y la propagación de errores, todas las informaciones aprendidas pasan por una validación interna que se efectúa mediante un modelo probabilístico que considera la cantidad de evidencias de que un determinado hecho puede ser verdadero y la cantidad de evidencias falsas. Eso es lo que hace que NELL  no confunda el nombre de un país con el de una ciudad al depararse con la frase “José Saramago nació en Portugal”, por ejemplo.

Según los autores de la investigación, un programa de computadora inteligente como NELL podría usarse en un sinnúmero de aplicaciones. En la propia internet, por ejemplo, podrá originar mecanismos de búsqueda más sofisticados, que en lugar de encontrar sencillamente páginas relacionadas con temas que buscamos, suministren respuestas a nuestras preguntas. En empresas, sistemas computacionales podrán ir adquiriendo experiencia y, al igual que los empleados más antiguos, acumular conocimiento que los vuelvan más eficientes con el correr del tiempo. También podrán usarse como asesores personales virtuales que aprenden sobre el perfil de sus usuarios y los atienden cada vez mejor, por ejemplo, desempeñando el rol de asistentes de noticias que buscan automáticamente contenidos en la web de interés del usuario.

El proyecto Read the web nació en 2008 durante una visita que Estevam Junior realizó al laboratorio del profesor Tom Mitchell, de la Universidad Carnegie Mellon. Ambos ya se conocían desde hacía tres años. En ese entonces el investigador brasileño desarrollaba un proyecto de programa Joven Investigador de la FAPESP sobre banco de datos. Aunque los objetivos del proyecto de Hruschka eran otros, surgieron intereses comunes y pasaron a trabajar asociados. “En enero de 2008, cuando llegué a Carnegie Mellon,  Tom y yo empezamos el trabajo oficial del Read the web. Al cabo del primer año de trabajo, logramos definir una arquitectura inicial y los principios básicos del nuevo paradigma de aprendizaje sin fin. Así iniciamos un prototipo del NELL”, comenta el investigador brasileño. En febrero de 2010 regresó a Brasil y dio inicio al proyecto Leitura de la web en Portugués, cuyos resultados en el futuro se integrarán al NELL. Acá no Brasil la iniciativa es financiada por el Consejo Nacional de Desarrollo Científico y Tecnológico (CNPq). En Estados Unidos recibe recursos de la empresa Google, de la Fundación Nacional de Ciencia (NSF, por sus siglas en inglés) y del Defense Advanced Research Proyects Agency (Darpa), la oficina de investigaciones del Departamento de Defensa estadounidense. Yahoo le cedió la supercomputadora M45 y Microsoft Research financia una beca de doctorado.

Otras instituciones y empresas financian programas a fin de dotar a las computadoras de algún tipo de inteligencia. Tal es el caso de IBM, titular de un proyecto llamado Respuestas a Preguntas (Cuestion Answering) destinado a investigar técnicas que permitan que una máquina responda antes las preguntas que le hagan los seres humanos. En tanto, el grupo del profesor Oren Etzioni, de la Universidad de Washington, Estados Unidos, también actúa en la extracción de conocimiento de páginas de la web, pero con un conjunto fijo de páginas previamente almacenadas y sin aplicar técnicas de aprendizaje continuo. “Tenemos una excelente relación con ambos grupos”. Con relación a las funciones del NELL, Hruschka destaca que “no posee autonomía para realizar ningún otro tipo de acción distinta de las de aprender en la web, almacenar ese conocimiento adquirido e interactuar con humanos –o con la propia web– para despejar dudas”. Es decir, el riesgo de que NELL se transforme en el futuro en HAL 9000 o en Skynet, el programa de computadora del film Terminator, que dominó el mundo aprendiendo en internet, es nulo. “El cambio de la forma en que las computadoras aprenden no es algo sencillo ni tampoco rápido. En la versión actual de NELL tenemos una computadora inteligente, pero estimamos que a mediados de 2014 podremos mostrar buena parte del potencial de esta idea.”

Republicar