A pandemia causada pelo novo coronavírus criou um fenômeno no meio científico que parece paradoxal: em meio à imperativa necessidade imposta por governos de vários países de distanciamento social, aumentam as iniciativas de projetos colaborativos, sobretudo no campo da inteligência artificial (IA). Unidos no espaço virtual, cientistas do Brasil e do mundo dedicados a desenvolver algoritmos de IA em universidades, centros de pesquisa e empresas têm direcionado tempo e conhecimento em busca de soluções para a crise.
Tais recursos já vêm sendo usados para previsão da disseminação da doença, apoio no diagnóstico e no tratamento, desenvolvimento de novas drogas e vacinas, gestão de leitos e insumos hospitalares e identificação de aglomerações de pessoas. Também análises econômicas que levam em conta os impactos do isolamento social e até combate às notícias falsas (fake news) usam IA como ferramenta.
O Instituto de Ciências Matemáticas e de Computação de São Carlos da Universidade de São Paulo (ICMC-USP) é uma das instituições que está, agora, inteiramente voltada a desenvolver soluções de IA para a atual emergência de saúde pública. Em parceria com a Universidade Federal do Pará (UFPA ), Instituto Nacional de Pesquisas Espaciais (Inpe) e Universidade Federal de São Paulo (Unifesp), os pesquisadores do ICMC estão elaborando um modelo matemático da evolução da pandemia adaptado à realidade demográfica do Brasil.
Segundo o cientista da computação André Carlos Ponce de Leon Carvalho, vice-diretor do ICMC-USP e membro do Instituto Avançado de Inteligência Artificial (AI²), consórcio formado por cientistas de várias universidades do país, o projeto utiliza como referência os relatórios e o modelo do Imperial College de Londres, que traçou possíveis cenários da disseminação do novo coronavírus em diversas partes do mundo.
Em 27 de março, a universidade britânica divulgou uma análise do impacto da pandemia em 202 países. Para o Brasil, as estimativas foram sombrias: mesmo adotando estratégias de isolamento social, o país poderia chegar a 44,2 mil mortes; se nenhuma medida fosse tomada, atingiria 1,15 milhão. Para o epidemiologista Neil Ferguson, que se manifestou por meio da assessoria de imprensa do Imperial College de Londres, as análises mostram que as intervenções de distanciamento social reduzem significativamente a disseminação da Covid-19. Mas ainda é prematuro estimar com que rapidez essas medidas podem fazer com que o número de novos casos diminua. “Os dados coletados nas próximas duas semanas serão cruciais para refinar nossa avaliação”, informou Ferguson.
Antecipar o que acontecerá no cenário brasileiro, distinto do asiático ou europeu, é a meta dos pesquisadores brasileiros. Segundo eles, embora o modelo matemático Seir (Susceptible-Exposure-Infected-Recovered) utilizado pelos britânicos seja um dos mais adotados pela comunidade internacional, é necessário criar um modelo que reproduza de forma mais fidedigna a realidade de países subdesenvolvidos. “É preciso levar em conta questões como a falta de saneamento básico e a existência de muitas pessoas vivendo em um mesmo cômodo”, exemplifica Carvalho.
“Estamos propondo um modelo matemático considerando aspectos relevantes da Pnad/IBGE [Pesquisa Nacional por Amostra de Domicílios do Instituto Brasileiro de Geografia e Estatística]. Com isso, queremos garantir que as projeções feitas pelos modelos tradicionais sejam implementadas de modo a levar em conta as restrições existentes em função da realidade nacional”, complementa o cientista da computação Renato Francês, da Faculdade de Engenharia da Computação da UFPA, parceira do ICMC nesse projeto. Além dos dados da Pnad/IBGE, os pesquisadores pretendem utilizar informações do Censo Escolar do Instituto Nacional de Estudos e Pesquisas Educacionais (Inep). O objetivo é mapear escolas que possam servir como bases alternativas para isolamento social de localidades superpopulosas.
Alerta antecipado
O estudo da curva de contágio adaptada às condições brasileiras também é o objetivo do grupo de pesquisa coordenado pelos cientistas da computação Solange Rezende e Ricardo Marcacini, do Laboratório de Inteligência Computacional do ICMC. Eles estão adaptando a ferramenta de mineração de dados e textos WebSensors, criada em 2013 – que surgiu como parte da pesquisa de doutorado de Marcacini, sob orientação de Rezende – para obter dados que possam ser incorporados aos modelos de previsão já existentes. Esse conhecimento complementar, obtido de informações extraídas de notícias relacionadas à epidemia – por exemplo “o que aconteceu”, “quando aconteceu” e “onde aconteceu” –, pode apoiar os especialistas na avaliação de iniciativas de combate à pandemia. Os dados diários de disseminação da Covid-19 no mundo são obtidos no Data Repository by Johns Hopkins CSSE, da Universidade Johns Hopkins, em Baltimore, nos Estados Unidos, enquanto as notícias, divulgadas em mais de 100 idiomas, são coletadas pela plataforma internacional GDELT – duas fontes com dados confiáveis.
Foi, inclusive, por intermédio da análise do noticiário que surgiram as primeiras informações sobre a ocorrência de um novo surto de doença respiratória na China. Em 9 de janeiro de 2020, a Organização Mundial da Saúde (OMS) emitiu seu primeiro informe oficial, mas 10 dias antes uma plataforma canadense de monitoramento de saúde, a BlueDot, já havia dado o alerta a seus clientes, sobretudo hospitais, agências e empresas de saúde. Empregando a tecnologia de processamento de língua natural (PLN), uma das vertentes da IA, a BlueDot analisou textos de centenas de fontes, em 65 idiomas. Por meio de fóruns de discussão, informes de empresas, de companhias aéreas, entre outros, a empresa foi capaz de antecipar os primeiros focos e a trajetória de disseminação da doença.
Criada pelo infectologista Kamran Khan, professor de medicina e saúde pública da Universidade de Toronto, no Canadá, a BlueDot tem utilizado inteligência artificial desde 2013 a fim de rastrear surtos de mais de 150 doenças e síndromes infecciosas em todo o mundo – o que lhe permitiu estar na linha de frente das informações sobre o novo coronavírus.
“A maior semelhança com o BlueDot é o tipo de dado utilizado para alimentar os Websensors, ou seja, eventos georreferenciados. Por outro lado, como diferença, vale destacar que nós não temos o objetivo de fazer recomendações ou gerar alertas de eventos que podem ocorrer, como fez o BlueDot”, esclarece Rezende, coordenadora do WebSensors. “Nosso objetivo é mais específico: identificar novos atributos para modelos existentes em diferentes aplicações.”
Identificação dos sintomas
Especialistas em IA também estão se unindo a cientistas da área da saúde na busca de novas soluções para diagnosticar e tratar a Covid-19. Dois projetos desenvolvidos por grupos de pesquisa vinculados ao ICMC visam orientar a população em relação aos sintomas da Covid-19 de modo a evitar uma sobrecarga dos prontos-socorros: um robô, ou chatbot, para tirar dúvidas sobre sintomas da doença pelo WhatsApp, e um assistente de voz para smartphone, com a mesma finalidade.
O robô já tem até nome: CheckCorona. Ele começou a ser desenvolvido no começo da pandemia, antes mesmo da explosão de casos no país, e foi colocado no ar no dia 29 de fevereiro. Para acioná-lo, basta adicionar o número +55 16 98112-8986 no WhatsApp, escrever CheckCorona e enviar a mensagem. Automaticamente, o chatbot começa a interagir com o usuário por mensagem de texto. Segundo o criador da ferramenta, o doutorando Murilo Gazzola, o CheckCorona foi programado para responder a perguntas simples a respeito de sintomas e, assim, fazer um primeiro atendimento a casos suspeitos.
O projeto do CheckCorona foi um dos 71 selecionados dentre 543 inscritos no “Desafio Covid-19”, realizado pelo Open Innovation Lab do Porto Digital, de Recife (PE). A competição foi uma iniciativa do Ministério Público e da Secretaria Estadual de Saúde de Pernambuco e laureou oito finalistas com prêmios que somaram R$ 1,3 milhão.
Com parceria da UFPA e de empresas do ramo de tecnologia, entre elas Google e IDK, o ICMC também está se dedicando a criar um assistente de voz, voltado, sobretudo, a dar informações por voz à população de 38 milhões de brasileiros semi ou não alfabetizados, segundo dados de 2018 da pesquisa Indicador de Alfabetismo Funcional (Inaf), realizada pela organização não governamental Ação Educativa e o Instituto Paulo Montenegro, com apoio do Ibope Inteligência. A ferramenta é desenvolvida por meio da tecnologia de PLN – a mesma usada pela canadense BlueDot para prever a trajetória de disseminação da doença – e deve ser lançada nos próximos dias.
Combate à doença
Na Faculdade de Saúde Pública da USP, o economista Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps), realiza estudos centrados, sobretudo, na probabilidade de uma pessoa morrer em consequência da Covid-19 – o que pode resultar numa ferramenta de apoio a decisões médicas, garantindo maior agilidade nas intervenções. “Deixamos outras pesquisas de lado para focarmos 100% no novo coronavírus e na pandemia associada a ele”, relata Chiavegatto, que lidera um grupo de 15 pesquisadores, entre os quais médicos, cientistas da computação e matemáticos.
Chiavegatto desenvolve, desde 2018, com apoio da FAPESP, um sistema para predição de ocorrência de óbitos. Ele usa no projeto dados do UK Biobank, estudo feito no Reino Unido que acompanhou 502,6 mil indivíduos com diferentes quadros de saúde entre 2006 e 2010. Agora, essa mesma tecnologia está sendo aplicada à Covid-19. O pesquisador explica que o sistema, baseado em aprendizado de máquina, tem como objetivo antecipar o risco de uma pessoa morrer, a partir de informações sobre seu estado clínico e dados como idade e doenças preexistentes.
Analisando centenas de casos de pacientes que já faleceram por causa da Covid-19, a ferramenta consegue estabelecer padrões de comparação e determinar que condições podem fazer com que uma pessoa tenha maior risco de sucumbir à doença. Mas, para estabelecer esses padrões de comparação, é importante que os formulários com dados clínicos dos pacientes (como hemograma e outros exames, por exemplo) estejam preenchidos corretamente e não faltem informações.
O objetivo dos integrantes do Lapdaps é obter dados em quantidade e, acima de tudo, em qualidade. Chiavegatto diz que, embora os sistemas de aprendizado de máquina dependam do volume de dados – quanto mais informações alimentam o sistema, maior a capacidade de estabelecimento de padrões –, a qualidade é ainda mais determinante para a eficácia da ferramenta. Ele estima que, se tiver dados confiáveis à mão, será possível concluir uma ferramenta viável para apoio a decisões clínicas ainda durante essa onda da pandemia.
“Estamos começando a estabelecer parcerias com hospitais de São Paulo e submetendo nosso projeto ao Comitê de Ética em Pesquisa da Plataforma Brasil”, informa Chiavegatto. A Plataforma Brasil é a via para submissão de projetos de pesquisa envolvendo seres humanos no país. “Há anos nos preparamos para uma emergência como essa”, declara o pesquisador.
Algoritmo para diagnóstico
Na China, país onde foram identificados os primeiros casos da nova doença, grandes companhias de tecnologia, como Baidu, dona de um dos maiores motores de busca na internet do mundo, e Alibaba, focada em comércio eletrônico, também dedicam seus setores de pesquisa ao enfrentamento da pandemia. E os resultados já começaram a aparecer. Em fevereiro, a Damo Academy, instituto de pesquisa do grupo Alibaba, anunciou a criação de um sistema de IA capaz de diagnosticar a Covid-19 a partir de imagens de tomografia computadorizada dos pulmões – uma vez que esse órgão, quando afetado pelo vírus Sars-CoV-2, apresenta, na imagem, um aspecto característico de vidro fosco. Segundo a empresa, o algoritmo foi treinado com imagens de tomografias de 5 mil casos confirmados da doença e consegue dar o diagnóstico em 20 segundos com 96% de precisão.
Em São Paulo, o Instituto de Radiologia (InRad) e o Hospital das Clínicas da Faculdade de Medicina (HC-FM) da USP estão empenhando esforços na mesma direção. Com um diferencial em relação ao sistema chinês: além de tomografia, as ferramentas de IA também avaliarão imagens de raios X. “Elas não oferecem a mesma qualidade de imagem de uma tomografia, mas podem ser o único recurso em muitas cidades brasileiras. Precisamos adaptar a tecnologia ao contexto do país”, considera o médico radiologista Giovanni Guido Cerri, presidente do Conselho Diretor do InRad e membro da Comissão de Inovação do HC-FM. Seu objetivo é oferecer uma ferramenta que possa ser acessada por qualquer médico a partir de seu computador pessoal.
Cerri conta que o InRad começou a trabalhar com inteligência artificial há cerca de dois anos, por meio de uma parceria com a alemã Siemens. A equipe é composta por cerca de 20 profissionais, entre médicos, engenheiros e cientistas da computação. O estudo de doenças pulmonares já era uma prioridade, juntamente com exames de mama, cérebro e próstata. Assim, não foi difícil adaptar a tecnologia ao diagnóstico da Covid-19 logo quando os primeiros casos foram confirmados no Brasil, no fim de fevereiro.
Para ter acesso a dados de pacientes que possam ensinar a máquina a identificar sinais da ação viral nos pulmões, ele conta com a colaboração do Hospital Sírio-Libanês, do Laboratório Fleury, ambos em São Paulo, e do Colégio Brasileiro de Radiologia e Diagnóstico por Imagem. O pesquisador afirma que, se conseguir reunir uma boa base de dados, será possível ter a ferramenta disponível no início de maio.
A conquista de novas drogas para prevenção e tratamento da doença certamente levará mais tempo, mas a IA também está sendo usada para acelerar esse processo. A startup britânica Exscientia, uma spinoff da Universidade de Dundee, na Escócia, usará inteligência artificial para examinar 15 mil potenciais drogas. A empresa espera descobrir um medicamento viável em até 12 meses.
A também britânica DeepMind, pertencente ao Google, está usando algoritmos para estudar as estruturas proteicas do Sars-CoV-2 a partir da sequência de aminoácidos. Esse conhecimento é fundamental para compreender como o vírus se comporta no organismo humano e o que pode ser feito para combatê-lo. Para agilizar o trabalho, a empresa está liberando em licença aberta os resultados preliminares, permitindo que qualquer cientista do mundo participe da pesquisa e compartilhe as descobertas.
Dilemas éticos
Se de um lado a inteligência artificial pode trazer uma agilidade nunca vista no âmbito da pesquisa científica, do outro pode criar novos desafios. O médico intensivista João Gabriel Rosa Ramos pesquisou o uso de um algoritmo de auxílio à tomada de decisão em uma situação limite: a priorização de vagas em unidades de terapia intensiva (UTI). Este foi o tema de seu doutorado em ciências médicas pela FM-USP, concluído em 2018. Ele explica que o algoritmo computadorizado pode ajudar os médicos a olhar a situação por diversos ângulos, ajudando-os a tomar uma decisão mais justa e eficaz, aliviando o peso da resolução. “Esses instrumentos, no entanto, servem para apoiar a tomada de decisão; não para substituir o julgamento clínico”, ressalta o pesquisador.
Segundo Ramos, que é diretor científico da Sociedade de Terapia Intensiva da Bahia (Sotiba), o uso de IA torna a escolha menos variável e potencialmente mais acurada. “A ciência cognitiva mostra que as tomadas de decisão frequentemente não são completamente racionais e objetivas, como gostamos de acreditar. Frequentemente, essas decisões são enviesadas e, possivelmente, guiadas por preconceitos implícitos”, afirma. Contudo, ele adverte que a própria ferramenta pode estar enviesada, dependendo da forma como foi construída. “Para garantir uma tomada de decisão ética seria necessário a existência de uma regulamentação pública e a possibilidade de regulação externa”, defende. Uma possibilidade, por exemplo, seria estabelecer uma instância de apelação caso a família não concorde com a decisão tomada pelo médico com auxílio da ferramenta de IA.
Formas de regulação devem ser igualmente criadas para os casos em que o esforço de controle da pandemia possa implicar a ameaça a direitos individuais. No começo de abril, o governo federal anunciou que terá acesso a dados de operadoras de celulares para identificar aglomerações de pessoas em todo o país e, assim, manter as medidas de distanciamento social para controlar a propagação do vírus. Algoritmos são capazes de fazer a gestão de um número gigantesco de dados que podem incluir geolocalização e o uso de compras de cartão para determinar o trajeto de uma pessoa contaminada e, assim, quebrar a cadeia de contágio. Caberá à Justiça definir que dados serão utilizados e como será feita essa gestão.
Medidas invasivas como essa levantam o debate sobre o direito à privacidade. Na Coreia do Sul, elas foram adotadas a fim de achatar a curva de contágio. No Brasil, o governo paulista, por meio do Instituto de Pesquisas Tecnológicas (IPT), vinculado à Secretaria de Desenvolvimento Econômico do Estado de São Paulo, firmou no início do mês um acordo de cooperação com a operadora de telefonia Vivo com a finalidade de monitorar o deslocamento da população em tempo real. Posteriormente, a parceria foi ampliada e incluiu também as empresas Claro, Oi e Tim.
Batizada de Sistema Inteligente de Monitoramento (Simi-SP) contra o novo coronavírus, a ferramenta utiliza dados de geolocalização dos celulares da população paulista para medir a adesão à quarentena. É feita, no entanto, uma análise de informações não individualizadas. As informações são apresentadas no formato de um “mapa de calor”, que indica os pontos de maior ou menor concentração populacional por localidade, em diferentes períodos do dia – o Simi-SP não vai identificar o usuário individualmente. Além de alertar sobre aglomerações perigosas ao contágio, o recurso também permite acompanhar o fluxo de pessoas em unidades básicas de saúde e hospitais. Com isso, a tecnologia ajuda as autoridades a saber onde se encontram as maiores concentrações de casos da doença.
Projetos
1. Predição de óbitos segundo causa básica com machine learning em uma amostra longitudinal de 502.632 indivíduos (nº 17/09369-8); Modalidade Auxílio à Pesquisa ‒ Regular; Pesquisador responsável Alexandre Dias Porto Chiavegatto Filho (USP); Investimento R$ 75.150,53.
2. Aprendizado de máquina para WebSensors: Algoritmos e aplicações (nº 14/08996-0); Modalidade Auxílio à Pesquisa ‒ Regular; Pesquisadora responsável Solange Oliveira Rezende (USP); Investimento R$ 96.460,64.
3. Plano de desenvolvimento institucional na área de transformação digital: manufatura avançada e cidades inteligentes e sustentáveis (PDIp) (nº 17/50343-2); Modalidade Auxílio à Pesquisa ‒ Programa Modernização de Institutos Estaduais de Pesquisa; Pesquisador responsável Zehbour Panossian (IPT); Investimento R$ 7.235.509,26