Imprimir PDF Republicar

Inovação em Parceria

Revisor Gramatical Automático em nova versão

Já está sendo comercializada a versão mais recente do Revisor Gramatical Automático para Português, desenvolvido pelo Núcleo Interinstitucional de Linguística Computacional da USP (campus de São Carlos) e a Itautec-Philco S. A., com apoio da FAPESP. O projeto para implementação do software é um dos 36 em andamento no âmbito do Programa de Parceria para Inovação Tecnológica (PITE), tendo a FAPESP participado com recursos da ordem de R$ 27 mil e a empresa com R$ 78 mil. O resultado da pesquisa foi tão significativo que a Microsoft demonstrou interesse em incorporar o Revisor ao processador de textos do Windows disponível para consumidores brasileiros. Segundo Elizabeth Costa, gerente do produto na Itautec, as negociações para licenciamento do Revisor junto à empresa estão bastante avançadas. “É possível que a próxima versão do Office, a ser lançada no Brasil, passe a incorporar nosso produto”, antecipa. “A Microsoft sempre se preocupou em desenvolver ambientes específicos de apoio à redação em todo o mundo, e este interesse veio ao encontro de nossos objetivos na área de Pesquisa e Desenvolvimento. Desde a criação da empresa, em 1980, pensamos em oferecer um bom revisor gramatical aos nossos clientes.

E a FAPESP trouxe uma solução para este problema. Através do Programa de Parceria para Inovação Tecnológica, conseguimos manter a equipe do projeto unida”, revela Elizabeth. A versão 6.0 do Revisor é fruto de pesquisas realizadas desde 1993, através de convênio entre a Itautec-Philco e a Fundação de Apoio à Física e à Química de São Carlos. O projeto vem sendo executado por uma equipe multidisciplinar de lingüistas e profissionais da área de Computação do NILC, com a participação de docentes do Departamento de Ciência da Computação e Estatística, do Instituto de Ciências Matemáticas e de Computação, e do Instituto de Física de São Carlos, coordenado pela professora Maria das Graças Volpe Nunes, do Departamento de Ciências da Computação e Estatística. O Revisor detecta um grande número de erros comuns cometidos por usuários de nível de segundo grau. É capaz de indicar e sugerir alternativas para erros ortográficos, mecânicos (colocação irregular ou falta de pontuação no final de frases, por exemplo) e erros gramaticais relativos ao uso da crase, regência, concordância verbal e nominal, colocação pronominal e inadequações lexicais e outros. O software não interfere no estilo, não padroniza a estrutura do texto, mas percorre sentença por sentença para verificar a estrutura sintática e oferecer opções gramaticalmente corretas de construção. O maior desafio, entretanto, ainda é o de solucionar todas as ambigüidades do ponto de visto semântico, ou seja, identificar todas as funções sintáticas que uma palavra ou expressão podem assumir numa frase.

“Na versão atual, o programa arrisca a função pela proximidade de um verbo ou adjetivo e sugere correções para as diferentes estruturas sintáticas decorrentes de cada um dos diferentes significados. A Língua Portuguesa admite textos muito complexos, para os quais só o cérebro humano pode atribuir sentido exato”, observa Elizabeth. Embora tenha sido desenvolvido a partir de um banco de textos que contém vários gêneros, com mais de 35 milhões de palavras — provavelmente o maior existente no País —, o dicionário interno do Revisor sempre poderá ser aperfeiçoado para incorporar mais e mais palavras. O próximo passo da equipe de pesquisadores envolvida com o Revisor Gramatical Automático é a introdução, em outubro, de uma mini-gramática que permitirá um aprofundamento maior no estudo do Português.

“Alguns usuários não consideram suficiente a ajuda prestada pela ferramenta. Com a gramática, será possível consultar exemplos, contra-exemplos e navegar por informações sobre todos os erros previstos no sistema”, explica Maria das Graças. Na forma de hipertexto, a gramática permitirá ir além da primeira consulta, que oferece informações muito resumidas para explicar o funcionamento da regra e ao mesmo tempo ensinar conceitos. Ela fará a correlação entre os erros cometidos e todos os tópicos contidos em um livro de gramática convencional de forma contextualizada, com base em textos contemporâneos e no texto do próprio usuário. “Já era hora de se ter um software como este para o Português. Agora, nossas pesquisas caminham no sentido de contemplar, principalmente, dois tipos de avanços: a detecção do maior número possível de erros, especialmente aqueles que requerem o tratamento do significado das palavras, e a diminuição dos falsos erros, ou seja, de intervenções desnecessárias do sistema, causadas pela ambigüidade sintática da língua”, planeja a pesquisadora.

Republicar