Aprendizado inteligente : Revista Pesquisa Fapesp

Gabriel bitar e nana lahozNão é de hoje que a ideia da existência de computadores inteligentes, capazes de raciocinar, aprender e tomar decisões de forma autônoma desperta a curiosidade e é retratada na ficção. A mais famosa dessas máquinas é, sem dúvida, o HAL 9000, personagem dotado de avançada inteligência artificial imortalizado no filme 2001, uma odisseia no espaço, dirigido por Stanley Kubrick em 1968. Mas será que um dia essas máquinas poderão sair do universo ficcional e tornar-se realidade? Vários pesquisadores, em todo o mundo, tentam responder a essa pergunta com projetos para tornar os computadores mais inteligentes. Um deles é o Read the Web – ou leitura na web –, um programa desenvolvido em parceria por pesquisadores da Universidade Federal de São Carlos (UFSCar) e da Universidade Carnegie Mellon, dos Estados Unidos. O grupo desenvolve um computador capaz de aprender de forma autônoma e de utilizar os conhecimentos já adquiridos para evoluir seu próprio aprendizado. O problema proposto é criar uma máquina que leia páginas da web e, a partir daí, melhore a capacidade de aprendizado do computador, de forma contínua.

“Queremos mostrar que com o atual desenvolvimento das técnicas de aprendizado de máquina, recuperação de informação e processamento de linguagem é possível construir um computador ‘inteligente’ e com capacidade para adquirir mais e mais conhecimentos, exatamente como nós fazemos”, explica o professor Estevam Rafael Hruschka Junior, do Departamento de Computação da UFSCar, coordenador brasileiro da iniciativa. Para atingir esse objetivo, a equipe construiu um programa de computador, batizado de NELL (iniciais de never-ending language learner), que busca um novo padrão de aprendizado de máquina chamado “aprendizado sem fim”. “É um novo paradigma. O computador aprende continuamente e não somente um tipo de conhecimento específico, mas também conhecimentos gerais e de senso comum que o auxiliarão a ampliar sua capacidade de aprendizado com o passar do tempo”, explica Hruschka.

Um aspecto importante do aprendizado sem fim é o acúmulo de experiência. Assim como nós, seres humanos, aprendemos conceitos mais complexos após adquirirmos conhecimentos mais básicos e simples – é mais fácil aprender álgebra depois de ter aprendido as operações aritméticas básicas –, o NELL se vale de sua experiência acumulada no processo de aprendizado futuro. “Da mesma forma que um funcionário mais antigo em uma empresa identifica situações que podem levar a equívocos e evitá-las, com o passar do tempo o NELL identifica estratégias sem muito sucesso no aprendizado e pode alterá-las de forma a aperfeiçoar o processo de aprendizado”, conta o pesquisador.

E como se dá o processo de aprendizado do NELL? Inicialmente, ele recebe informações que definem qual deve ser o seu foco específico no aprendizado. “Inserimos no NELL, em forma de arquivos de entrada, os conceitos que estamos interessados que ele aprenda e que relacionamentos entre esses conceitos são importantes para nós”, explica Hruschka. A partir daí o programa começa a “ler” arquivos na internet para extrair conhecimento de temas específicos. Para entender como esse aprendizado funciona, ele conta como o NELL aprende o nome das cidades do mundo. “Em princípio fornecemos ao computador algumas dicas de leitura que o auxiliarão na identificação de cidades em termos encontrados na internet. Podemos dizer a ele que sempre que achar a sentença ‘X é uma cidade localizada …’, o termo X refere-se a uma cidade. Após a leitura e identificação de algumas cidades, o NELL tem condições de definir autonomamente novas formas de identificação de cidades, utilizando, por exemplo, a sentença ‘a Prefeitura Municipal de X’.”

No geral, o NELL aprende fatos que são relação entre duas categorias, como “eu moro em… (cidade, país, etc.)” ou “ele joga no… (time de vôlei, futebol)”. No total, o computador já domina 280 tipos de relações – e esse número cresce continuamente. Para evitar o aprendizado e a propagação de erros, toda informação apreendida passa por uma validação interna feita por meio de um modelo probabilístico que considera a quantidade de evidências de que aquele determinado fato possa ser verdadeiro e a quantidade de evidências falsas. É isso que faz, por exemplo, que o NELL não confunda o nome de um país com o de uma cidade ao se deparar com a frase “José Saramago nasceu em Portugal”.

Segundo os autores da pesquisa, um programa de computador inteligente como o NELL poderia ser usado em inúmeras aplicações. Na própria internet, por exemplo, ele poderá originar mecanismos de busca mais sofisticados que, em vez de simplesmente encontrar páginas relacionadas com temas que procuramos, forneçam respostas às nossas perguntas. Em empresas, sistemas computacionais poderão ir adquirindo experiência e, assim como funcionários mais antigos, acumular conhecimento que os tornem mais eficientes com o passar do tempo. Também poderão ser usados como assessores pessoais virtuais que aprendem sobre o perfil de seus usuários e os atendem cada vez melhor – por exemplo, desempenhando o papel de assistentes de notícias que buscam automaticamente conteúdos na web de interesse do usuário.

O projeto Read the web nasceu em 2008 durante uma visita que Estevam Junior fez ao laboratório do professor Tom Mitchell, da Universidade Carnegie Mellon. Os dois já se conheciam havia três anos. Na época o pesquisador brasileiro tinha um projeto do programa Jovem Pesquisador da FAPESP sobre banco de dados. Embora os objetivos do projeto de Hruschka fossem diferentes, surgiram interesses comuns de pesquisa e eles passaram a trabalhar em parceria. “Em janeiro de 2008, quando cheguei à Carnegie Mellon, iniciamos, Tom e eu, o trabalho oficial do Read the web. Após o primeiro ano de trabalho conseguimos definir uma arquitetura inicial e os princípios básicos do novo paradigma de aprendizado sem fim. Assim, iniciamos um protótipo do NELL”, conta o pesquisador brasileiro. Em fevereiro de 2010 ele retornou ao Brasil e iniciou o projeto Leitura da web em Português, cujos resultados deverão ser integrados no futuro ao NELL. Aqui no Brasil a iniciativa é financiada pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq). Nos Estados Unidos, recebe recursos da empresa Google, da Fundação Nacional de Ciência (NSF, na sigla em inglês) e do Defense Advanced Research Projects Agency (Darpa), escritório de pesquisa do Departamento de Defesa norte-americano. A Yahoo cedeu o supercomputador M45 e a Microsoft Research financia uma bolsa de doutorado.

Outras instituições e empresas financiam programas com a finalidade de dotar os computadores de algum tipo de inteligência. É o caso da IBM, detentora de um projeto chamado Respostas a Perguntas (Question Answering) para investigar técnicas que permitam uma máquina responder a perguntas feitas por seres humanos. Já o grupo do professor Oren Etzioni, da Universidade de Washington, nos Estados Unidos, também atua na extração de conhecimento de páginas da web, mas com um conjunto fixo de páginas previamente armazenadas e sem aplicar técnicas de aprendizado contínuo. “Temos um ótimo relacionamento com os dois grupos.” Em relação às funções do NELL, Hruschka destaca que “ele não possui autonomia para nenhum outro tipo de ação diferente da de aprender na web, armazenar esse conhecimento adquirido e interagir com humanos – ou com a própria web – para tirar dúvidas”. Ou seja, o risco de o NELL se transformar no futuro no HAL 9000 ou no Skynet, o programa de computador do filme Exterminador do futuro, que dominou o mundo aprendendo a partir da internet, é nulo. “Mudar a forma como os computadores aprendem não é algo simples nem tampouco rápido. Na versão atual do NELL já temos um computador inteligente, mas acreditamos que até meados de 2014 poderemos mostrar boa parte do potencial desta ideia.”

Republicar