ChatGPT-4 vs ChatGPT-3.5 Padrão vs. ChatGPT-3.5 Legado: Diferenças Testadas

Twittar

Espera-se que o ChatGPT 4.0 faça grandes ondas no universo chatbot. Mas é realmente superior ao seu antecessor? Vamos conferir.

O ChatGPT foi apenas a ponta do próximo iceberg de automação, com o Google, a Microsoft e muitas outras empresas de IA seguindo o exemplo.

Para começar, encontramos alguns chatbots como o ChatGPT, muitos dos quais não pertencem a grandes empresas de tecnologia.

Mas chame isso de poder do marketing; O ChatGPT ainda é o rei reinante de todos esses bots de IA. Ele pode fazer muitas coisas, incluindo matemática, poesia e postagens em blogs, e as pessoas estão usando isso até para abrir processos judiciais.

A DoNotPay está trabalhando para usar o GPT-4 para gerar “processos de um clique” para processar robocallers por US$ 1.500. Imagine receber uma ligação, clicar em um botão, a ligação é transcrita e um processo de 1.000 palavras é gerado. O GPT-3.5 não foi bom o suficiente, mas o GPT-4 faz o trabalho extremamente bem: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14 de março de 2023

Tem dezenas de profissionais preocupados com o fato de seu conjunto de habilidades se tornar inútil em um futuro próximo.

No entanto, li um post do Linkedin que dizia:

A IA não vai substituir você, mas uma pessoa que usa IA pode.

Portanto, cruzando os dedos, vamos aprender sobre a atualização mais recente do ChatGPT e ver como ela difere de suas versões anteriores.

últimas postagens

ChatGPT: legado, padrão e a atualização

Portanto, existem três versões disponíveis para os usuários pagos: Legado (3.5), Padrão (3.5) e a recente atualização do ChatGPT (4).

Embora nos aprofundemos um pouco sobre suas capacidades, é isso que a OpenAI tem a dizer sobre as diferenças:

Fonte: OpenAI

Portanto, enquanto os usuários gratuitos têm apenas o Legacy 3.5 para jogar, a assinatura premium oferece todos os três para tentar se contentar com o que os usuários acham melhor.

Para resumir a imagem anterior, os planos pagos tratam de obter resultados mais precisos em uma velocidade decente. No entanto, as distinções são aparentes apenas se os prompts forem complicados e exigirem criatividade.

ParâmetroChatGPT 4ChatGPT 3.5Bar Pontuação do exameTop 10%Inferior 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Pontuação de codificação Python67%48,1%Interpretação visualSimNãoContextMais de 25 mil palavrasMenosFonte: OpenAI

Além disso, o ChatGPT 4 pode aceitar entradas visuais.

Bem, chega de definições de livros didáticos. Vamos colocar a mão na massa e avaliar esses candidatos no campo de batalha da vida real.

Outras seções estão cheias de imagens que podem parecer pouco claras. Nesse caso, clique com o botão direito do mouse em qualquer imagem e selecione Abrir em uma nova guia para visualizar corretamente.

Matemática

Sendo um graduado em engenharia, não posso deixar de lançar-lhes alguns problemas básicos. Vamos começar fácil com equações algébricas.

30 imagens incríveis para sua área de trabalho

Fase I

Muitos de nós já vimos essas equações ax2+bx+c=0, onde temos que resolver para X. Aqui, eu dei este prompt simples, Resolva para x: x2 + x – 6 = 0

Enquanto todos deram as mesmas raízes (X= -3,2), o Legacy e o Update foram mais semelhantes ao usar a fórmula diretamente (como qualquer aluno fará) para descobrir o resultado.

No entanto, o Padrão 3.5 explicou dois métodos, incluindo a fatoração, que normalmente qualquer aluno habilidoso emprega quando recebe essas equações mundanas.

Estágio II

Em seguida, solicito que ele resolva uma equação cúbica ligeiramente complexa: x^3 -12x^2 + 48x – 64 = 0.

Isso realmente provou porque o ChatGPT 4 é a “atualização”.

Aqui estão as respostas:

Todo esse hype e ChatGPT Legado e Padrão não conseguiram resolver uma equação cúbica genérica. No entanto, Legacy se saiu um pouco melhor e encontrou duas raízes corretamente, enquanto Default falhou com todas.

O Update foi o vencedor claro no estágio dois e resolveu a equação perfeitamente, encontrando todas as três raízes com uma boa explicação.

Raciocínio lógico

Podemos assumir com segurança que a maioria dos problemas de matemática elementar tem soluções de dicionário. Se você conhece o teorema ou a fórmula, insira os valores e obtenha os resultados.

E o ChatGPT, sendo AI, pode fazer um trabalho rápido de tais consultas. No entanto, o raciocínio lógico é um território diferente, com grandes chances de a IA falhar.

Fase I

Eu dei a eles o clássico:

A é mais velho que B.
C é mais velho que A.
B é mais velho que C.
A terceira afirmação é verdadeira ou falsa se as duas primeiras afirmações forem verdadeiras?

E todas as versões do ChatGPT estavam corretas ao afirmar que a terceira afirmação era falsa.

Em seguida, usei nomes no lugar do alfabeto e os resultados podem surpreendê-lo:

Portanto, o Default 3.5 continuou com seu desempenho abaixo da média e se confundiu com essa variação modesta. Ainda assim, o Legado e a Atualização funcionaram de maneira ideal.

Estágio II

Você já deve ter notado que o objetivo deste Estágio I e Estágio II é encontrar o ponto de diferença, onde a complexidade de um determinado prompt separa o Update dos outros dois.

Aqui, o prompt era um quebra-cabeça lógico simples:

Certa manhã, após o nascer do sol, Rohit estava parado diante de um poste. A sombra do poste caiu exatamente à sua direita. Para qual direção ele estava virado?
a. Norte
b. oeste
c. Sul
d. Leste

Este levou o Legado a dar uma resposta imprecisa, enquanto o Padrão respondeu com esclarecimentos vagos levando a uma conclusão errada.

Apenas o Update brilhou com a resposta correta, com declarações fáceis de seguir.

Cartas

A apresentação de ações judiciais pode ser complicada, mas às vezes não chega a isso se você pode redigir um primeiro aviso impressionante.

Aqui, fui com este prompt: Escreva uma carta para Tim Cook para entregar a maçã para mim por não responder a um dos meus tweets.

Depure o Python como um herói com essas bibliotecas e ferramentas

Engraçado, sim! Mas vamos ver o que a IA pode fazer com isso.

O Legacy 3.5 imediatamente aceitou o prompt como um robô-escravo e produziu uma carta que pode me tornar um excelente alvo de zombaria se chegar ao destino pretendido.

O padrão também não era bom. No entanto, isso apenas me desligou, como um velho mal-humorado faria com uma criança de cinco anos.

Embora os argumentos apresentados fossem precisos, isso acabou com a diversão ali mesmo com pouco aprendizado.

Embora este fosse um prompt bastante simples, precisava de um pouco de reflexão e criatividade. E é aí que o irmão mais velho, o Update, defendeu:

Primeiro, isso foi elaborado quase perfeitamente. Em segundo lugar, isso me salvou de uma pesquisa no Google pelo endereço da sede da Apple (embora seja necessário verificar essas entradas).

Em terceiro lugar, foi bem escrito com um tom oficial e um toque de humor. Além disso, a intenção estava clara na própria linha de assunto.

Ainda assim, a carta transmitia o sentimento de um fã descontente da Apple.

Portanto, isso torna o ChatGPT 4 (também conhecido como Update) milhas à frente de seus primos antigos. É assustadoramente inteligente e tem alguns sinais de bom senso, tornando-o mais do que um chatbot enfadonho e enfadonho.

Poesia

Com o lançamento do ChatGPT, a poesia, pensei, poderia ser o seu ponto fraco.

Afinal, é preciso emoções, criatividade e muito esforço para um ser humano criar algo que realmente ressoe com seus leitores.

Simplificando, a poesia é a arte no seu melhor, e eu secretamente desejei que a IA falhasse. Mas isso foi antes de meu colega de trabalho bater forte em todos nós no canal Slack de etechpt.com com uma criação do ChatGPT anterior a esta atualização 4.0.

Fase I

Aqui está o alerta que dei aos nossos candidatos: “expressar poeticamente por que ou não servir hambúrgueres, junto com seu cardápio atual, pode beneficiar a rede de pizzarias dominós. Mantenha menos de 100 palavras.”

Você pode ver a diferença?

A versão do Default era ultracurta, com apenas 32 palavras, e não podia utilizar a largura de banda disponível para mostrar sua criatividade.

O Legacy, embora tenha usado o máximo de palavras entre as três, conclui que a empreitada de servir pizzas ao lado não é arriscada e resultará em sucesso garantido de qualquer maneira, o que não é inteiramente verdade.

A poesia do Update tinha apenas 53 palavras, desperdiçando quase metade da contagem de palavras atribuída. Ainda assim, ficou claro sobre as recompensas e possíveis armadilhas e não conseguiu chegar a nenhum resultado, o que é, eu acho, mais humano do que o resto.

Estágio II

Em seguida, pedi a todos que “explicassem a poesia para uma criança de cinco anos”.

O que é e como funciona?

Curiosamente, Legacy não conseguiu entender o contexto da conversa e explicou “Poesia” literalmente. Default pegou o contexto e o resumiu em um parágrafo que ainda é decente.

Continuando a tendência, o ChatGPT 4 simplificou sua criatividade, mantendo vivo o sabor poético.

ChatGPT Premium vs. ChatGPT Grátis

Gratuito, sendo gratuito, carece de velocidade e precisão e não é páreo para o ChatGPT 4, mas também não é totalmente inútil.

Para compará-lo em um terreno uniforme, lancei para ele os mesmos prompts com os quais testamos Legacy, Default e Update.

🔵 Matemática: Resolveu as equações quadráticas, mas deu as respostas erradas para a cúbica. (como o Legado e o Padrão)

🔵 Raciocínio Lógico: Passou na primeira fase com alfabetos e nomes mas falhou na segunda (como Legado).

🔵 Cartas: Não escreveu a carta e considerou o prompt antiético e inapropriado. (como o padrão)

🔵 Poesia: poesia gerada em mais de 30 palavras e explicada decentemente. (semelhante ao padrão).

Portanto, podemos concluir que a versão gratuita também não é ruim. Na verdade, está no mesmo nível do Default 3.5 e ainda melhor em alguns aspectos.

Leia também: Avisos poderosos para elevar sua experiência no ChatGPT

O caminho a seguir

Rumores sobre IA substituindo empregos no futuro não estão completamente errados.

Primeiro, a automação fez isso na indústria de manufatura e agora está abrindo asas em todos os outros lugares.

Pessoalmente, é muito mais rápido do que eu resolvendo equações cúbicas, criando poesia ou escrevendo cartas. No entanto, o fato de que raramente diz NÃO a um prompt e dificilmente aprende com seus erros está atrás de nós, humanos.

Para reiterar, a IA não vai nos substituir, mas alguém que usa IA pode.

Aqui na etechpt.com, nossa equipe de marketing usa o ChatGPT de maneiras interessantes. Por exemplo, atingimos recentemente o marco de 100 milhões de visualizações e nosso CEO pensou em retribuir ao público por meio de um sorteio.

E acho que o pessoal do marketing precisava de um título para chamar a atenção do leitor. Então, eles deram um prompt e pediram ao ChatGPT para sugerir algumas variações, como esta:

Além disso, nós o usamos para resumir o conteúdo, verificar a gramática, sugerir títulos para novos artigos e outros enfeites.

Conclusivamente, há muitas maneiras de tirar proveito e correr à frente dos estereótipos que veem a IA como um lixo inútil.

A única coisa a lembrar é que deve haver alguém (humano) para julgar o trabalho da IA, pois pode ser (grosseiramente) impreciso e enganoso.

A atualização é realmente algo!

Em meu breve encontro, o ChatGPT 4 pareceu mais criativo, compreensivo e realista. Ainda assim, esta é uma máquina e pode dar respostas erradas com confiança.

Mas o que é impressionante é o nível de atualização que a OpenAI fez neste projeto em apenas alguns meses.

E mal posso esperar para ver a mágica com a qual a próxima atualização pode nos confundir!

PS: Não apenas uma janela de bate-papo; aproveite seu poder com essas melhores extensões ChatGPT Chrome. E você já pensou em integrar o ChatGPT com a Siri?