Teste de Turing Obsoleto? 5 Alternativas Incríveis!

Há mais de sete décadas, quando a ideia de inteligência artificial começou a tomar forma, Alan Turing publicou um estudo que delineava como identificá-la. Esse estudo, mais tarde, ficou conhecido como o teste de Turing e tem sido utilizado por muitos anos para distinguir entre um ser humano e uma IA.

Contudo, com a chegada de chatbots de IA sofisticados, como o ChatGPT e o Google Bard, está se tornando mais complicado discernir se estamos interagindo com uma inteligência artificial. Isso levanta uma questão crucial: o teste de Turing ainda é relevante? E, caso não seja, quais alternativas podemos considerar?

O teste de Turing está obsoleto?

Crédito da imagem: Jesus Sanz/Shutterstock

Para determinar se o teste de Turing permanece válido, é essencial entender seu funcionamento. Para que uma IA seja aprovada no teste de Turing, ela deve ser capaz de persuadir um avaliador humano de que é um ser humano. No entanto, existe um problema fundamental: a IA é avaliada em comparação com um humano e deve se comunicar apenas por meio de texto.

Imagine a seguinte situação: você é o avaliador e está fazendo perguntas a dois participantes online, utilizando apenas texto. Um deles é um modelo de IA. Seria possível diferenciá-los após cinco minutos de interação? É importante lembrar que o objetivo do teste de Turing não é identificar o modelo de IA pelas respostas corretas, mas sim avaliar se a IA consegue pensar ou agir de maneira semelhante a um humano.

O problema com a abordagem do teste de Turing, que se concentra em respostas parecidas com as humanas, é que ela não considera outros fatores importantes, como o nível de inteligência do modelo de IA ou o conhecimento do avaliador. Além disso, o teste de Turing se limita a texto, o que torna cada vez mais difícil identificar uma IA que consegue gerar uma voz humana ou vídeos deepfake que imitam o comportamento humano.

Apesar disso, os modelos de IA atuais, como o ChatGPT-4 e o Google Bard, ainda não alcançaram um ponto em que possam passar no teste de Turing de forma consistente. Na verdade, se você estiver familiarizado com IA, é bem possível identificar textos que foram criados por ela.

As 5 melhores alternativas para o teste de Turing

É provável que modelos futuros de IA, como o ChatGPT-5, consigam passar no teste de Turing. Se isso acontecer, precisaremos de outros testes, além do teste de Turing, para confirmar se estamos interagindo com uma IA ou um ser humano. Abaixo estão as melhores alternativas para o teste de Turing:

1. O Teste de Marcus

Gary Marcus, um renomado cientista cognitivo e pesquisador de IA, propôs uma alternativa ao teste de Turing, que foi publicada no The New Yorker, para avaliar a capacidade cognitiva de uma IA. O teste é direto: você avalia um modelo de IA com base em sua habilidade de assistir e entender vídeos do YouTube e programas de TV sem legendas ou texto. Para que uma IA seja aprovada no teste de Marcus, ela deve ser capaz de compreender sarcasmo, humor, ironia e o enredo ao assistir aos vídeos, e explicá-los da mesma forma que um humano faria.

Embora o GPT-4 seja capaz de descrever imagens, ainda não existe um modelo de IA que consiga entender vídeos como um ser humano. Carros autônomos se aproximam dessa capacidade, mas não são totalmente autônomos e dependem de sensores, pois não conseguem compreender tudo que acontece ao seu redor.

2. O Teste Visual de Turing

De acordo com um estudo publicado na PNAS, o teste visual de Turing pode ser usado para determinar se estamos interagindo com um ser humano ou uma IA através de questionários com imagens. Ele funciona de maneira semelhante ao teste de Turing original, mas em vez de responder a perguntas usando texto, os participantes veem imagens e precisam responder a perguntas simples, pensando como um ser humano. O teste visual de Turing difere dos CAPTCHAs, pois todas as respostas são válidas, mas para passar no teste, a IA precisa processar as imagens de forma semelhante a um humano.

Adicionalmente, se uma IA e um ser humano receberem várias imagens lado a lado e forem solicitados a identificar as imagens que parecem reais, o humano teria a capacidade cognitiva de passar no teste. Isso acontece porque os modelos de IA têm dificuldade em distinguir imagens que não parecem ter sido tiradas no mundo real. Na verdade, essa é a razão pela qual é possível identificar imagens geradas por IA através de anomalias que não fazem sentido.

3. O Teste Lovelace 2.0

A ideia de que um computador não pode criar ideias originais além do que foi programado para fazer foi inicialmente proposta por Ada Lovelace, antes mesmo do teste de Turing. No entanto, Alan Turing discordava dessa teoria, argumentando que a IA ainda poderia surpreender os humanos. Somente em 2001, foram estabelecidas as diretrizes para o teste de Lovelace, com o objetivo de diferenciar uma IA de um ser humano. De acordo com thekurzweillibrary, as regras foram revisadas em 2014.

Para que uma IA seja aprovada no teste de Lovelace, ela deve demonstrar que consegue gerar ideias originais que vão além do seu treinamento. Os modelos de IA atuais, como o GPT-4, não conseguem criar novas invenções que superem o nosso conhecimento atual. No entanto, a inteligência artificial geral pode alcançar essa capacidade e ser aprovada no teste de Lovelace.

4. Teste de Turing Reverso

Que tal o teste de Turing, mas feito de forma inversa? Em vez de tentar determinar se estamos falando com um humano, o objetivo do teste de Turing reverso é enganar a IA, fazendo-a acreditar que somos uma IA. Para isso, também é preciso outro modelo de IA para responder às mesmas perguntas usando texto.

Por exemplo, se o ChatGPT-4 for o avaliador, podemos incluir o Google Bard e um ser humano como participantes. Se o modelo de IA conseguir identificar corretamente o participante humano com base nas respostas, ele é aprovado no teste.

A desvantagem do teste de Turing reverso é que ele não é totalmente confiável, especialmente porque, às vezes, a IA não consegue distinguir conteúdo gerado por IA de conteúdo escrito por humanos.

5. Estrutura de Classificação de IA

Segundo a estrutura de classificação de IA desenvolvida por Chris Saad, o teste de Turing é apenas um método de avaliação para saber se estamos interagindo com uma IA. Mais precisamente, a estrutura de classificação de IA é baseada na teoria das inteligências múltiplas, que afirma que a inteligência humana deve satisfazer pelo menos oito critérios diferentes, que incluem: ritmo musical, inteligência lógico-matemática, identificação visual, inteligência emocional, inteligência autorreflexiva, capacidade de pensamento existencial e movimento corporal.

Como a IA é avaliada em oito parâmetros diferentes, é pouco provável que ela supere um ser humano, mesmo que tenha um desempenho acima da média em alguns critérios específicos. Por exemplo, o ChatGPT consegue resolver problemas matemáticos, descrever imagens e conversar em linguagem natural como um humano, mas falharia em outras categorias estabelecidas na estrutura de classificação de IA.

O teste de Turing não é conclusivo

O teste de Turing foi concebido mais como um experimento mental do que como um teste definitivo para diferenciar humanos de IA. Quando foi inicialmente proposto, ele serviu como referência para medir a inteligência das máquinas.

No entanto, com o recente desenvolvimento de modelos de IA com recursos interativos de fala, visuais e auditivos, o teste de Turing se mostra limitado, já que se restringe a conversas textuais. A solução mais eficaz seria adotar alternativas ao teste de Turing que consigam diferenciar de forma mais eficaz os modelos de IA dos seres humanos.