A Anthropic realizou um experimento chamado Project Deal, no qual agentes de IA representaram compradores e vendedores em um mercado de itens usados entre funcionários, com dinheiro real. A empresa utilizou 69 participantes, dando a cada um um orçamento de $100 para comprar itens de colegas, resultando em 186 negócios totalizando mais de $4.000.
Quatro mercados separados foram criados com diferentes modelos de IA. No mercado real, todos os participantes usaram o modelo mais avançado da Anthropic. A empresa observou que agentes mais avançados geraram “resultados objetivamente melhores” para seus usuários, mas os próprios usuários não perceberam a disparidade. Isso levanta preocupações sobre lacunas na qualidade dos agentes, onde pessoas em desvantagem podem não perceber que estão piores. As instruções iniciais não afetaram a probabilidade de vendas ou preços negociados.
O experimento, embora pequeno e com viés de autosseleção, demonstrou o potencial e os desafios de agentes autônomos negociando em nome de humanos. A Anthropic destacou a necessidade de garantir que todos os participantes estejam cientes da capacidade de seus agentes para evitar assimetrias de informação.

