IAs superam humanos em teste de ‘enganação’ criado por AlanTuring

Pesquisa mostra que modelos avançados de linguagem já conseguem convencer usuários de que são humanos em conversas por texto

IAs superam humanos – Um estudo conduzido pela University of California San Diego apresentou evidências de que sistemas modernos de inteligência artificial já conseguem superar o tradicional teste de Turing, criado em 1950 pelo matemático britânico Alan Turing. A pesquisa revelou que participantes humanos tiveram dificuldade para distinguir pessoas reais de modelos avançados de linguagem em conversas realizadas por texto.

O trabalho foi publicado na revista científica Proceedings of the National Academy of Sciences e analisou o desempenho de diferentes sistemas de IA em testes controlados. Segundo os pesquisadores, esta foi a primeira vez em que modelos de linguagem foram identificados como humanos com frequência semelhante, e em alguns casos até superior, à de participantes reais dentro do formato originalmente proposto por Turing.

LEIA: NOVIDADE! Zere sua contribuição assistencial e associativa na Bee Fenati!

Conversas paralelas avaliaram capacidade das Ias

Durante o experimento, cada participante manteve duas conversas simultâneas: uma com um ser humano e outra com um sistema de inteligência artificial. A missão era descobrir qual dos interlocutores era realmente humano.

A pesquisa contou com dois grupos independentes: estudantes da UC San Diego e participantes recrutados por meio da plataforma Prolific. Ao todo, quase 500 pessoas participaram dos testes.

Os pesquisadores avaliaram quatro modelos de linguagem. Entre eles estavam sistemas avançados, como GPT-4.5 e LLaMa-3.1-405B, além de modelos utilizados como referência comparativa, como GPT-4o e o clássico chatbot ELIZA.

Segundo o estudo, o GPT-4.5 foi considerado humano em 73% das interações, desempenho que superou inclusive os próprios participantes humanos na avaliação dos interrogadores. Já o LLaMa-3.1-405B foi identificado como humano em 56% das conversas, índice considerado estatisticamente equivalente ao de pessoas reais.

Os modelos utilizados como base de comparação tiveram desempenho significativamente inferior. O ELIZA foi apontado como humano em cerca de 23% das vezes, enquanto o GPT-4o atingiu aproximadamente 21%.

Instruções de personalidade foram decisivas

De acordo com os autores, os resultados dependeram diretamente das instruções fornecidas aos sistemas. Cada modelo recebeu um “prompt de persona”, orientando a IA a adotar estilos de comunicação e características consideradas humanas.

Segundo Cameron Jones, autor correspondente do estudo, os modelos conseguiram reproduzir elementos como humor, tom de voz, objetividade e até erros típicos de humanos.

Quando essas instruções mais detalhadas não eram utilizadas, o desempenho caiu de forma expressiva. O GPT-4.5 teve a taxa de sucesso reduzida para 36%, enquanto o LLaMa-3.1-405B caiu para 38%.

Para Ben Bergen, coautor da pesquisa, o teste passou a medir principalmente a capacidade de parecer humano, e não necessariamente inteligência.

Pesquisadores alertam para riscos online

Os autores também destacaram possíveis impactos do avanço dessas tecnologias em ambientes digitais. Segundo Jones, sistemas capazes de se passar por humanos em conversas longas podem tornar mais difícil a identificação de bots por usuários comuns.

O pesquisador afirmou que as pessoas devem ter menos certeza de que estão interagindo com seres humanos ao conversar com desconhecidos na internet. Ele também alertou para riscos relacionados à manipulação e ao uso de sistemas automatizados para enganar usuários.

Bergen acrescentou que bots podem ser utilizados para persuadir pessoas a compartilhar informações pessoais, influenciar decisões políticas ou promover produtos.

Testes tiveram duração de até 15 minutos

Para realizar os experimentos, os pesquisadores desenvolveram uma interface semelhante a aplicativos de mensagens instantâneas. Os participantes visualizavam duas conversas simultaneamente e sabiam que apenas uma delas era conduzida por um humano.

Após cinco minutos (ou 15 minutos em uma versão de replicação do estudo) os participantes precisavam decidir qual interlocutor era a pessoa real.

Os estudantes da UC San Diego apresentaram desempenho ligeiramente superior na identificação dos humanos. Segundo os pesquisadores, isso pode estar relacionado ao compartilhamento de experiências em comum e referências locais do campus.

 

Junte cashback e transfira para sua conta com a Benefícios Rede Bee!

A Bee Fenati – a rede social dos profissionais de TI de todo o Brasil – segue em expansão para garantir aos seus usuários cada vez mais benefícios. Agora a plataforma conta com a Benefícios Rede Bee, que reúne descontos em dezenas de grandes marcas, com muitas delas oferecendo cashback, ou seja, o retorno de um valor da sua compra que poderá ser transferido direto para sua conta!

Baixe o aplicativo nas lojas App Store e Google Store e aproveite agora! A Bee Fenati reúne em um único ambiente ofertas em áreas como educação, compras, viagens, lazer, serviços, tecnologia e muito mais. Dentre as marcas parceiras estão Magalu, Renner, Drogasil, C&A, Dell, Casas Bahia, Vivo, Petz, Drogaria São Paulo, e muito mais!

Além de poderem aproveitar os descontos oferecidos pelas marcas parceiras, os usuários da plataforma receberão de volta um percentual a cada compra que realizarem em parceiros que oferecem o cashback.

Este valor ficará em uma carteira digital dentro da plataforma da Benefícios Rede Bee e, a partir de R$ 20 reais acumulados em cashback, o trabalhador pode transferir o dinheiro direto para sua conta bancária!

Na prática, a ferramenta permitirá que sócios e contribuintes dos sindicatos filiados à Fenati (Federação Nacional dos Trabalhadores em Tecnologia da Informação) possam ZERAR o valor da sua contribuição assistencial e associativa!

Atualmente, o valor da contribuição é de R$ 32,50 por mês para sócios e R$ 35 por mês para contribuintes, ou seja, é possível recuperar todo esse valor e ainda acumular muito mais – tudo isso contribuindo para fortalecer a categoria e transformando as compras e serviços do cotidiano em ganho real.

 

(Com informações de Olhar Digital)

(Foto: Reprodução/Magnific/joelmirbarbosa)

Leia mais