A startup paulista NeuralMind iniciou no ano passado o desenvolvimento de uma ferramenta de inteligência artificial (IA) para auxiliar a fiscalização de denúncias de fraudes em compras públicas do Tribunal de Contas da União (TCU). Batizada de Instrução Assistida com Inteligência Artificial (Inacia), a solução é um buscador de informações em documentos jurídicos escritos na língua portuguesa, desenvolvido pela empresa, que se integra ao modelo de previsão de linguagem GPT-4, da OpenAI.
Seu objetivo é fornecer aos analistas do TCU informações mais precisas quando precisam fazer buscas em processos que estão sendo analisados. “O sistema auxilia o auditor a entender mais rápido quais são os principais fatos dos documentos, ao reunir as provas apresentadas e informar as jurisprudências sobre aquele tema”, explica o engenheiro da computação Roberto Lotufo, um dos fundadores da startup, instalada no Parque Científico e Tecnológico da Universidade Estadual de Campinas (Unicamp). O software NeuralSearchX, desenvolvido pela empresa, utiliza redes neurais para fazer buscas mais precisas em coleções de documentos em português. O processo foi detalhado em artigo publicado em março de 2024 na revista Digital Government: Research and Practice.
O desenvolvimento do NeuralSearchX ocorreu em um dos 383 projetos baseados em soluções de IA apoiados pelo programa Pesquisa Inovativa em Pequenas Empresas (Pipe), da FAPESP, nos últimos 26 anos. O número de projetos Pipe nessa área tem aumentado em ritmo acelerado. Apenas na última década, cresceu cerca de 20 vezes. Em 2013, eram apenas três projetos de IA financiados, totalizando cerca de R$ 245 mil; 10 anos depois, contabilizaram-se 61, com investimento de quase R$ 12,8 milhões (ver gráfico abaixo). Desde o primeiro ano do programa Pipe, em 1997, as áreas que concentraram mais projetos de IA foram ciências exatas e da Terra (43%), seguidas por engenharias (23%) e ciências agrárias (12%).
“A inteligência artificial é a onda tecnológica do momento”, observa o cientista da computação Rodolfo Azevedo, coordenador-geral de Tecnologias e Parcerias em Inovação da FAPESP e professor do Instituto de Computação da Unicamp. Ele explica que a Fundação prioriza o financiamento de empresas que explorem novas maneiras de usar essas tecnologias. “É importante também que as startups procurem inovar barateando processos e tornando-os escalonáveis. Assim, elas têm o potencial de melhorar a vida das pessoas”, afirma.
Um dos caminhos mais comuns seguido por essas empresas, segundo Azevedo, é usar arquiteturas ou algoritmos já consolidados e extrair novas informações e usos, aplicando-os a uma base de dados própria ou integrando novas soluções, como é o caso do buscador da NeuralMind integrado ao GPT. “Boa parte do período em que as empresas são financiadas pelo Pipe é usada em capacitar mão de obra, ainda escassa na área, e treinar os modelos de IA para funcionalidades personalizadas”, complementa.
“O crescimento verificado nos últimos anos reflete o cenário de expansão de empresas de IA no Brasil e no mundo”, avalia o cientista da computação Eduardo de Rezende Francisco, do Departamento de Tecnologia e Data Science da Escola de Administração de Empresas de São Paulo da Fundação Getulio Vargas (FGV EAESP). De acordo com o levantamento Emerging Tech Report 2024, da plataforma de startups Distrito, 45% das 2.252 startups de tecnologias emergentes mapeadas na América Latina são focadas em IA, seguida por internet das coisas (IoT), com 16%, e dataficação, o processo de transformação de informações em dados digitais, representando 12% do total. O Brasil lidera o mercado latino-americano com 74% das startups de IA.
O estudo da Distrito também aponta que, nos últimos seis anos, as startups de tecnologias emergentes da América Latina receberam US$ 3,8 bilhões em investimentos. O setor de IA responde por 60% desse volume – US$ 2,4 bilhões. “Investimentos públicos não reembolsáveis, como os do programa Pipe, têm papel fundamental para incentivar a pesquisa e a inovação com mais liberdade, principalmente no contexto da IA”, observa Francisco.
Globalmente, o mercado de inteligência artificial foi estimado em US$ 196,6 bilhões em 2023, segundo a consultoria de inteligência de mercado Grand View Research. O setor é liderado por Estados Unidos, China, União Europeia e Reino Unido. Em 2022, apenas o valor do investimento privado em IA foi de US$ 92 bilhões, 18 vezes superior ao de 2013, de acordo com outro relatório, o AI Index Report 2023, elaborado pelo Stanford Institute for Human-Centered Artificial Intelligence (HAI), ligado à Universidade Stanford, nos Estados Unidos.
Mapeando a insônia e os riscos climáticos
A startup Vigilantes do Sono, incubada no Hospital Israelita Albert Einstein, na capital paulista, que recebeu financiamento do programa da FAPESP, criou um aplicativo de mesmo nome que usa aprendizagem de máquina para propor ao usuário estratégias que ajudem a melhorar a qualidade do sono. Entre suas principais funcionalidades, destacam-se um protocolo para tratar a insônia, baseado na terapia cognitivo-comportamental, e uma ferramenta de triagem para apneia do sono.
A seção sobre insônia se desdobra em conversas guiadas por um robô ou chatbot. Já o teste de apneia utiliza sensores do smartphone, como câmera, acelerômetro e microfone, para detectar características físicas e comportamentais associadas ao distúrbio. “A ideia é oferecer uma abordagem mais disponível para a saúde do sono, especialmente no Brasil, onde o acesso a tratamento e laboratórios especializados é limitado. Queremos, um dia, chegar ao SUS [Sistema Único de Saúde]”, diz a psicóloga Laura Castro, sócia-fundadora e diretora de psicologia e pesquisa da empresa.
O desenvolvimento, o treinamento e a validação do algoritmo para a área de apneia, módulo mais recente do aplicativo, foram estruturados durante um projeto Pipe fase 2 (ver box) ainda em andamento. O objetivo é auxiliar a detecção de sintomas de risco da doença, como uma espécie de triagem. Dependendo do resultado, a ferramenta sugere caminhos aos usuários, como procurar atendimento médico especializado. Informa também onde podem encontrá-lo. Cerca de 80 mil pessoas se cadastraram no programa desde o lançamento em janeiro de 2020 – cerca de 5 mil completaram o programa de insônia e 2,5 mil o de apneia. Parte das funcionalidades precisa ser comprada pelos usuários, mas o teste de apneia está em acesso aberto.
Já a startup MeteoIA, de São Paulo, outra participante do Pipe, desenvolveu um sistema baseado em redes neurais para criar modelos personalizados de riscos climáticos de longo prazo – o período varia dependendo da aplicação, mas a média é de um ano de antecedência. Os modelos têm aplicações diversas, como a realização de previsões para concessionárias de rodovias de deslizamentos de taludes (encostas inclinadas) ou de anomalias climáticas que afetam a produção agrícola.
A empresa trabalha com dados públicos e históricos fornecidos pelos clientes para personalizar seus modelos. Na área de energia, a startup desenvolveu um modelo para hidrelétricas, treinado durante dois projetos Pipe entre novembro de 2020 e abril de 2024, que elabora a previsão de chuvas nas bacias hidrográficas do Sistema Interligado Nacional (SIN), a rede de produção e distribuição de energia elétrica do país.
“O sistema prevê anomalias de chuvas nos próximos 12 meses e tem 70% de acurácia. Não estima o dia exato em que ela vai ocorrer, mas os meses em que há mais chances de haver um nível de precipitação superior ao esperado”, explica o cientista Thomas Martin, cofundador da startup. Recentemente, a empresa finalizou um projeto para prever a tendência de mudança das chuvas nos próximos 30 anos para a Engie Brasil, prestadora de serviços de geração, comercialização e transmissão de energia elétrica no país.
Onda começou em 2012A última década foi marcada por grandes avanços nas tecnologias de inteligência artificial (IA), o que ajuda a explicar o boom de empresas que surgiram em todo o mundo nos últimos 12 anos. “Essa onda de inteligência artificial começou a tomar forma em 2012. Na área de hardware, as GPU [Unidades de Processamento Gráfico] da multinacional de tecnologia Nvidia permitiram processar dados de maneira massiva e descobriu-se que elas eram boas para tecnologias de IA”, informa o cientista da computação Marcelo Finger, do Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP).
Essas GPUs passaram a ser usadas para treinar redes neurais profundas, por serem capazes de fazer operações matemáticas simples em altíssima velocidade. Redes neurais profundas são modelos que fazem reconhecimento de padrões massivamente, cuja unidade básica, quando foi proposta na década de 1950, supunha-se análoga ao um neurônio humano, e se apoiam em aprendizado de máquina, um campo de estudo que permite extrair padrões de grandes volumes de dados e fazer predições a partir deles.
Em paralelo, também em 2012, a arquitetura AlexNet mostrou que as redes neurais eram mais eficazes que outros modelos de aprendizado de máquina para treinar reconhecimento de imagens, um marco para a área de IA. Alguns anos depois, em 2017, houve outro momento importante: o surgimento das tecnologias Transformers, usadas na arquitetura de redes neurais e que integram os grandes modelos de linguagem (LLM).
“Brinco com meus alunos que antes de 2017 estávamos na pré-história da IA”, diz o cientista da computação da USP. Foi nessa mesma época, a partir de 2016, que o número de projetos de IA do programa Pesquisa Inovativa em Pequenas Empresas (Pipe), da FAPESP, aumentou consideravelmente. Ele observa que as tecnologias Transformers são um tipo de IA bastante disseminado nas pesquisas atuais, para fazer classificação de dados em grandes modelos de linguagem.
O terceiro marco histórico, segundo Finger, foi o lançamento em novembro de 2022 do ChatGPT, modelo de IA generativa capaz de criar textos, dados e imagens. O programa revelou as inúmeras possibilidades de uso dessas tecnologias, que rapidamente se popularizaram.
O que é o programa PipeCriado em 1997 para apoiar pesquisas científicas ou tecnológicas em micro, pequenas e médias empresas paulistas, o programa tem quatro fases. A primeira, focada na viabilidade técnico-científica da proposta, tem duração de até nove meses e o orçamento pode chegar a R$ 300 mil. Na fase 2, com até 24 meses, o foco é o desenvolvimento da pesquisa. O financiamento máximo é de R$ 1,5 milhão.
A fase 3, que depende da publicação de um edital, é focada no desenvolvimento comercial e industrial de produtos, processos, sistemas ou serviços inovadores feitos a partir de pesquisas anteriores realizadas pela empresa, apoiadas ou não pela FAPESP.
Há também o Pipe Invest, focado em acelerar a chegada ao mercado de projetos da fase 2, quando houver uma terceira parte interessada. Tem duração de até 24 meses e um financiamento-limite de R$ 1,5 milhão. Não é preciso passar pela fase 1 para pleitear um projeto fase 2, mas a proposta deverá demonstrar a viabilidade técnica da pesquisa.
Projetos
1. Validação do NeuralSearchX para buscas em bases tributárias e integração com MS Office (nº 22/13727-5); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Roberto de Alencar Lotufo (NeuralMind); Investimento R$ 431.363,96.
2. QUEST ‒ Sistema de busca e agregação de informações baseado em técnicas Zero-Shot (nº 2022/01640-2); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Rodrigo Frassetto Nogueira (NeuralMind); Investimento R$ 1.048.816,23.
3. Sistema inteligente para análise de jurisprudência usando técnicas modernas de aprendizado profundo aplicadas ao processamento de linguagem natural (nº 2020/09753-5); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Rodrigo Frassetto Nogueira; Investimento R$ 431.078,52.
4. Leitura robusta de documentos cadastrais usando deep learning (nº 19/06667-3); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Roberto de Alencar Lotufo (NeuralMind); Convênio Sebrae-SP; Investimento R$ 662.802,81.
5. Sistema para leitura robusta de textos em imagens utilizando deep learning (nº 2018/01188-7); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Roberto de Alencar Lotufo (NeuralMind); Investimento R$ 410.479,61.
6. Fenotipagem inteligente com aprendizado de máquina para personalização terapêutica em programa digital de melhoria do sono (nº 21/12139-0); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisadora responsável Laura de Siqueira Castro (Vigilantes do Sono); Investimento R$ 957.782,71.
7. MIA: Sistema de inteligência artificial para previsão subsazonal de variáveis hidrometeorológicas no Brasil (nº 20/00566-8); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Thomas Christian Marcel Martin (Meteoia Datascience); Investimento R$ 457.307,60.
8. MIA: sistema de inteligência artificial para previsão subsazonal de variáveis hidrometeorológicas no Brasil (nº 21/14700-0); Modalidade Pesquisa Inovativa em Pequenas Empresas (Pipe); Pesquisador responsável Thomas Christian Marcel Martin (Meteoia Datascience); Investimento R$ 583.435,78.
Artigo científico
PEREIRA et al. INACIA: Integrating large language models in Brazilian audit courts: Opportunities and challenges. Digital Government: Research and Practice. mar. 2024.
Republicar