5Por correlações distorcidas

Nem sempre os dados disponíveis são suficientes para traçar correlações precisas e são usadas informações substitutas. Exemplo: moradores de uma determinada região têm maiores problemas com inadimplência e um sistema hipotético de IA usa esse dado para decidir se clientes de um banco podem receber empréstimos. Se o CEP da residência tiver relação com a origem racial, ao considerar a região de moradia o sistema discriminaria a etnia

De onde vem o viés

Em um estudo que se tornou referência na área, Solon Barocas, professor de Ética e Política em Ciência de Dados da Universidade Cornell, Estados Unidos, e organizador do workshop internacional Justiça, Responsabilidade e Transparência na Aprendizagem de Máquina, detalha maneiras de se estabelecer o viés algorítmico.

1Pela definição do alvo

Para que a máquina inicie seu aprendizado, ela precisa saber que informações buscar. Exemplo: se o objetivo é criar um filtro de spam, ela precisa aprender quais são os atributos ou características de uma mensagem que se deseje rotular como spam. Pode ser o endereço de IP ou determinadas frases do conteúdo (“pílula mágica para perda de peso”, “milhões de dólares para você” etc.)