guia do novo coronavirus
Imprimir PDF Republicar

Ciência aberta

Um notebook na mão, um projeto na cabeça

Workshop incentiva compartilhamento de dados e uso de ferramentas tecnológicas para melhorar a qualidade de pesquisas

Liyao Xie / Getty images e Constantine Johnny / Getty images

Até que ponto é possível executar um projeto de pesquisa de qualidade sem dispor de financiamento algum? Um grupo de 30 estudantes e pesquisadores de vários lugares do Brasil e de diferentes disciplinas esteve reunido virtualmente durante duas semanas em agosto para experimentar formas de produzir conhecimento novo mesmo sem contar com orçamento ou promessa de recursos. O workshop “No-Budget Science Hack Week” mostrou que, sim, há meios de fazer ciência de baixo custo alcançando resultados relevantes. Um dos requisitos é utilizar dados já disponíveis e compartilhados de forma aberta – há material abundante a ser explorado em bancos de dados econômicos e sociais e repositórios de informações primárias obtidas em pesquisas de todas as áreas do conhecimento. Outra premissa é empregar ferramentas computacionais, entre as franqueadas na internet, para organizar e analisar a massa de informações, de modo a extrair achados originais ou tendências ainda não observadas. “A filosofia da ciência sem orçamento é ‘um notebook na mão e uma ideia na cabeça’”, explica o idealizador do workshop, o médico Olavo Amaral, professor do Instituto de Bioquímica Médica da Universidade Federal do Rio de Janeiro (UFRJ).

Apesar do nome, a ambição do Hack Week não é exatamente estimular modelos de pesquisa que dispensem financiamento, ainda que isso seja útil em um momento de escassez de recursos. O investimento público e privado em ciência, na avaliação dos participantes, continua sendo crucial para o avanço do conhecimento e o desenvolvimento social. “Nosso objetivo é estimular novas práticas de pesquisa e desenvolver ferramentas tecnológicas que ajudem a melhorar a ciência”, explica Amaral, que há tempos se preocupa com o aperfeiçoamento dos processos que envolvem a atividade científica. Há dois anos ele criou a Iniciativa Brasileira de Reprodutibilidade, um projeto financiado pelo Instituto Serrapilheira que pretende repetir uma centena de experimentos de artigos científicos brasileiros da área biomédica para verificar o quanto é possível reproduzir os resultados que foram publicados (ver Pesquisa FAPESP nº 267). A capacidade de confirmar os achados de um estudo em trabalhos posteriores é importante para que a ciência possa avançar com base em conhecimento acumulado e verificável, preservando assim a confiança no processo científico e em seus resultados.

Muitas das práticas incentivadas no workshop se enquadram no conceito de ciência aberta, um movimento que estimula o compartilhamento de dados e a pesquisa cooperativa e em rede para resolver problemas que o trabalho fechado em laboratórios tem dificuldade de solucionar. Outra concepção que norteia a iniciativa é a metaciência, que consiste no uso da metodologia científica para ampliar a eficiência do método científico e reduzir o desperdício de recursos.

Essa foi a segunda edição do workshop – e a primeira que adotou o formato virtual, em decorrência da pandemia. Como não houve gastos com estadia, o dinheiro para organizar o evento acabou devolvido aos patrocinadores: a Universidade de São Paulo (USP) e o Serrapilheira. Cerca de 50 participantes se inscreveram, apresentando seus interesses de pesquisa, e 30 foram selecionados pela comissão organizadora, composta por seis membros. Na primeira semana, as propostas foram discutidas pelos participantes, que escolheram as mais promissoras e com potencial para gerar resultados no curto período de tempo do workshop. Com a orientação de especialistas, foram analisadas formas de viabilizá-las. Já na segunda semana, os participantes dedicaram-se à execução dos projetos.

Cada integrante comprometeu-se a dedicar ao menos três horas por dia às tarefas do workshop. Enquanto uma equipe construía uma base de dados com projetos de divulgação científica desenvolvidos no país, outra procurava criar um programa capaz de rastrear, nas referências bibliográficas de artigos científicos, os chamados dados pseudoabertos – links de endereços na internet que parecem dar acesso a uma fonte original de informações, mas que, quando são clicados, não levam a lugar nenhum, por descuido ou falta de atualização. Um grupo escrutinou documentos da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) relacionados a programas de pós-graduação do país em fisiologia para avaliar até que ponto eles contemplam os Princípios de Hong Kong, um conjunto de recomendações para a avaliação de pesquisadores que propõe mais transparência, diversidade e compartilhamento de informações. Constataram, por exemplo, que 91,3% dos programas oferecem aos alunos de mestrado e/ou doutorado alguma disciplina relacionada a boas práticas de pesquisa, como metodologia científica, bioestatística e escrita científica, embora, na maioria dos casos, elas não sejam obrigatórias.

O avanço dos repositórios de preprints, plataformas nas quais é possível divulgar trabalhos rapidamente, ainda que com resultados não avaliados por revisores de revistas científicas, serviu de inspiração para um projeto que investigou a participação de autores brasileiros nessa modalidade de publicação e outro que explorou o conteúdo dos preprints sobre Covid-19 divulgados entre janeiro e agosto através de nuvens de palavras e redes semânticas. Na maior parte dos casos, as equipes chegaram apenas a resultados parciais, que agora serão desenvolvidos pelos pesquisadores – a maioria deles informou que deseja levar os projetos adiante. Cumpriu-se, de todo modo, a intenção do workshop de incentivar os participantes a conhecer as práticas da ciência aberta para multiplicá-las em seu ambiente de trabalho.

O paranaense Vanderson Martins do Rosario, que faz doutorado em ciência da computação na Universidade Estadual de Campinas (Unicamp), ficou sabendo do Hack Week por um post no Twitter e se inscreveu prontamente. “A metaciência se ampara muito na análise de dados e requer as habilidades do cientista da computação”, considera. Ele atuou em duas equipes no workshop. Uma delas foi a que analisou o perfil dos brasileiros que publicam em repositórios de preprints. A tarefa se revelou complexa para as duas semanas de trabalho, mas foi possível chegar a alguns resultados ao menos para a área da saúde, cruzando bases de dados disponíveis nos repositórios medRxiv e bioRxiv com os da plataforma brasileira de currículos Lattes. “Observamos que cresce de forma exponencial o uso desses repositórios pelos nossos pesquisadores”, explica. O estágio na carreira dos autores do país que publicaram preprints foi comparado com o de um grupo de controle formado por cientistas que não utilizaram essas plataformas. “A geração mais jovem tende a publicar preprints com frequência bem maior que a dos mais velhos”, afirmou.

Há material abundante para se analisar em bancos de dados econômicos e sociais, prontuários médicos e repositórios de pesquisa

Outro projeto a que Rosario se associou foi a compilação de um catálogo de projetos de divulgação científica no Brasil. “Senti falta de um serviço desse tipo quando fui procurar podcasts sobre ciência em serviços de streaming e estavam misturados com os de astrologia”, afirma. Os desafios eram obter informações sobre blogs, podcasts e canais do YouTube sobre ciência e criar uma plataforma para cadastrá-los e catalogá-los. “Tivemos de selecionar os dados que deveriam ser coletados para que um sistema de busca eficiente funcionasse. São informações como o meio em que o projeto é disseminado, a área de interesse e o nome do responsável.” A etapa seguinte envolveu o trabalho manual de cadastrar cada projeto. “O Instituto Serrapilheira nos passou os registros dos últimos editais de projetos de divulgação científica que promoveu e também utilizamos outras fontes. Há listas do Twitter e do YouTube e uma relação de blogs feita pela Unicamp. Criamos robôs para coletar os dados.” O resultado foi uma ferramenta que consegue fazer uma busca refinada dos projetos – a ideia é que esteja disponível para consulta em breve. “Fiquei feliz porque o projeto foi ideia minha e deu para extrair informações interessantes.”

A Hack Week estimulou contatos entre pesquisadores de gerações diferentes. Com quase três décadas de carreira, a fisioterapeuta Ligia de Loiola Cisneros, docente da Escola de Educação Física, Fisioterapia e Terapia Ocupacional da Universidade Federal de Minas Gerais (UFMG), soube do workshop por um aluno e se animou a assistir a uma apresentação on-line. “O Olavo Amaral fez uma live muito inspiradora que me deu novas ideias de metodologias para adotar”, explica. O interesse dela pela ciência aberta vem de uma experiência recente. Cisneros está fazendo um estágio de pós-doutorado no programa em instrumentação biomédica e reabilitação na Universidade Estadual Paulista (Unesp), campus de Ilha Solteira, e utilizou recursos de inteligência artificial para construir uma rede neural com dados de pacientes que sofrem de pé diabético, complicação que pode levar a amputações. Redes neurais são modelos computacionais baseados em aprendizado de máquina que se inspiram na organização do sistema nervoso. A ferramenta permite prever a evolução e o desfecho dos casos quando os pacientes procuram atendimento. “Há uma enorme quantidade de informações nos prontuários de pacientes de hospitais de referência que podem ser usados em outros serviços em benefício de futuros pacientes”, afirma.

Em workshops que aconteceram no evento paralelamente à execução dos projetos, o economista e epidemiologista Alexandre Chiavegatto Filho, da Faculdade de Saúde Pública da USP, deu uma palestra aos participantes do workshop sobre aprendizado de máquina e Cisneros propôs a ele uma parceria em uma nova pesquisa. “Falei de um projeto que eu queria submeter à Fapemig [Fundação de Amparo à Pesquisa do Estado de Minas Gerais] e ele entrou conosco na proposta”, diz. Na Hack Week, ela se integrou ao grupo que fez a análise semântica de trabalhos sobre a Covid-19 publicados como preprints. “Conseguimos mostrar como o perfil das publicações foi evoluindo ao longo do tempo. Eles começam falando de um lugar na China, Wuhan, depois se disseminaram pela Europa e os Estados Unidos e evoluíram para a preocupação em identificar o vírus e desenvolver testes diagnósticos.”

Oldimar Cardoso, pesquisador das áreas de história e educação, propôs um projeto para fazer uma análise semântica do conteúdo de 40 mil livros didáticos adquiridos pelo Ministério da Educação desde 1998. Doutor pela Faculdade de Educação pela USP e especialista em plataformas digitais de aprendizagem, ele planeja fazer um pós-doutorado sobre o assunto. “Há poucas iniciativas de metaciência no campo das humanidades e eu vi na Hack Week uma boa oportunidade de atrair outros pesquisadores para minha área de interesse”, afirma. A estratégia não deu certo – seu projeto acabou não sendo selecionado entre os que seriam abordados no workshop, mas Cardoso não esmoreceu. Participou das discussões sobre a análise dos documentos das comissões de pós-graduação e, por fim, integrou-se à equipe que analisou os preprints sobre Covid-19. Ao final, ficou satisfeito com a experiência. “Meus conhecimentos foram úteis para os grupos e os conceitos que aprendi terão aplicação em meu projeto sobre a análise semântica dos livros didáticos.”

O farmacêutico Gabriel Lovate nunca havia trabalhado com ciência aberta. Ele faz mestrado em bioquímica na Faculdade de Medicina de Ribeirão Preto (FMRP) da USP, com bolsa da FAPESP, e estuda genes que conferem resistência a antibióticos. Mas se sensibilizou com a mobilização de pesquisadores da FMRP-USP para trabalhar de forma virtual e cooperativa durante a pandemia em estudos sobre o novo coronavírus e se interessou em conhecer as práticas propostas pelo workshop. Sugeriu um projeto para ampliar e facilitar o acesso a plataformas de biologia computacional de universidades brasileiras, que não foi selecionado. Acabou se envolvendo no projeto sobre os dados pseudoabertos. “Esse é um gargalo para a ciência aberta. Não é incomum que trabalhos científicos tenham referências com endereços na internet que não funcionam. Parecem que estão disponíveis, mas não estão”, explica. Seu grupo analisou um conjunto de periódicos da área de ciências biológicas disponíveis na biblioteca de revistas de acesso aberto SciELO. Foi realizada uma raspagem de dados, técnica por meio da qual um programa de computador extrai informações de páginas da web, que selecionou os links disponíveis. O passo seguinte foi avaliar de forma automatizada se funcionavam ou não. “Alguns periódicos tinham muitos links quebrados, mas ainda precisaremos validar a técnica”, explica. A intenção é seguir desenvolvendo a ferramenta e transformá-la em uma extensão para browsers que, quando acionada, informará quais links das referências de um trabalho científico são inválidos.

Uma nova edição do No-Budget Science Hack Week está programada para acontecer em meados de 2021, de forma presencial, se a evolução da pandemia permitir.

Republicar