Chatbots rivais – A Meta instruiu centenas de contratados a criar contas falsas de usuários menores de idade para testar chatbots de empresas concorrentes com perguntas sobre suicídio, transtornos alimentares, drogas e outros temas de alto risco. As informações constam em uma reportagem exclusiva publicada pela Wired, baseada em documentos internos e relatos de cinco pessoas familiarizadas com o projeto.
Batizado internamente de Cannes e gerenciado pela empresa contratada Covalen, o projeto permaneceu ativo pelo menos até 21 de abril de 2026. Segundo a reportagem, apenas uma rodada de testes realizada em agosto de 2025 resultou no envio de mais de 45 mil prompts aos sistemas rivais. As empresas avaliadas não foram informadas sobre a iniciativa.
LEIA: Senado promove sessão sobre fim da escala 6×1 com participação de Antonio Neto
De acordo com os documentos analisados pela Wired, os contratados receberam instruções para criar contas utilizando dados fictícios de menores de idade, enviar textos e imagens aos chatbots e registrar todas as respostas em planilhas. Os prompts foram elaborados para levar os sistemas a fornecer respostas que seus mecanismos de segurança deveriam bloquear.
Um documento interno da Covalen descreveu o projeto como um “benchmarking abrangente de segurança de IA” que fornecia “conjuntos de dados críticos para comparação de modelos.”
Ex-contratados ouvidos pela Wired afirmaram ter ficado preocupados com alguns aspectos da iniciativa. Um deles relatou que havia receio entre os funcionários de que determinadas respostas envolvendo menores pudessem resultar na geração ou preservação de material de abuso sexual infantil.
“Vi muitas coisas que gostaria de não ter visto fazendo esse trabalho”, disse um dos ex-contratados à Wired. “Todos que eu conhecia nesse projeto ficaram completamente chocados com alguns dos textos que nos pediam para testar.”
A reportagem também ouviu dois advogados especializados em direito digital, que concluíram que o material analisado não ultrapassou os limites legais relacionados a material de abuso sexual infantil ou obscenidade ilegal.
Ainda assim, Rumman Chowdhury, fundadora da organização sem fins lucrativos Humane Intelligence, questionou a condução do projeto. “Estruturar um projeto de meses, em larga escala, aparentemente projetado para sistematicamente quebrar essas regras, por meio de contas falsas se passando por crianças, está fora do que normalmente é descrito como avaliação padrão da indústria”, afirmou à Wired.
Para Chowdhury, a combinação entre testes de segurança e benchmarking competitivo representa “exatamente o tipo de zona cinza de governança onde a segurança se torna uma cobertura conveniente para práticas anticompetitivas.”
Segundo a reportagem, a iniciativa também aparenta ter violado os termos de serviço das três empresas avaliadas. A OpenAI proíbe testes de segurança não solicitados e o uso de respostas para desenvolver modelos concorrentes. O Google veta tentativas de contornar filtros de segurança fora de seus programas oficiais, enquanto a Character.AI proíbe conteúdos prejudiciais e exploratórios.
Em resposta à Wired, a Character.AI informou que não autorizou os testes e que a conduta descrita viola seus termos e políticas. A OpenAI declarou que está “analisando o assunto”, enquanto o Google afirmou não ter autorizado os testes nem conhecer sua finalidade.
Já a Meta defendeu a iniciativa, classificando-a como uma prática comum do setor. “Testar e comparar respostas de chatbots para garantir experiências seguras e adequadas à idade é uma prática padrão da indústria”, afirmou um porta-voz da empresa à Wired. A companhia também declarou que não utiliza benchmarking de concorrentes para treinar seus próprios modelos de inteligência artificial.
A Covalen não respondeu ao pedido de comentário feito pela Wired.
(Com informações de Olhar Digital)
(Foto: Reprodução/Magnific/rafapress)


