O aguardado ChatGPT 4.0 está gerando grande expectativa no universo dos chatbots. Mas será que ele realmente supera seu antecessor? Vamos analisar.
O ChatGPT foi apenas o ponto de partida para uma nova era de automação, com gigantes como Google e Microsoft, e muitas outras empresas de IA, seguindo seus passos.
Atualmente, encontramos diversos chatbots semelhantes ao ChatGPT, muitos dos quais não são desenvolvidos por grandes corporações de tecnologia.
Entretanto, o ChatGPT ainda se mantém como o líder incontestável entre os bots de IA. Ele possui a capacidade de realizar tarefas como cálculos matemáticos, compor poesias e criar posts para blogs, e há quem o utilize até mesmo para dar início a processos judiciais.
A DoNotPay está trabalhando para utilizar o GPT-4 na criação de “processos judiciais com um clique” para processar empresas que realizam chamadas de telemarketing indesejadas, com o objetivo de obter indenizações de até US$ 1.500. Imagine receber uma ligação, clicar em um botão, a ligação ser transcrita e um processo de 1.000 palavras ser gerado. O GPT-3.5 não tinha capacidade suficiente, mas o GPT-4 está fazendo um excelente trabalho: pic.twitter.com/gplf79kaqG
— Joshua Browder (@jbrowder1) 14 de março de 2023
Essa evolução tem deixado muitos profissionais preocupados com a possibilidade de suas habilidades se tornarem obsoletas em um futuro próximo.
No entanto, li uma publicação no LinkedIn que dizia:
A IA não irá substituir você, mas uma pessoa que utiliza IA poderá.
Portanto, com essa perspectiva, vamos explorar a mais recente atualização do ChatGPT e comparar suas diferenças em relação às versões anteriores.
ChatGPT: As Versões Legado, Padrão e a Nova Atualização
Atualmente, existem três versões disponíveis para usuários pagantes: Legado (3.5), Padrão (3.5) e a recente atualização do ChatGPT (4).
Antes de analisarmos detalhadamente suas funcionalidades, veja o que a OpenAI tem a dizer sobre as diferenças:
Fonte: OpenAI
Enquanto os usuários gratuitos têm acesso apenas ao Legado 3.5, a assinatura premium oferece as três versões para que os usuários possam escolher aquela que melhor se adapta às suas necessidades.
Em resumo, os planos pagos oferecem resultados mais precisos e em uma velocidade razoável. No entanto, as diferenças se tornam mais evidentes quando os comandos são complexos e exigem um alto nível de criatividade.
Parâmetro | ChatGPT 4 | ChatGPT 3.5 |
Pontuação no Exame | Top 10% | Inferior 10% |
AI2 Reasoning Challenge (ARC) | 96,3% | 85,2% |
Pontuação de codificação Python | 67% | 48,1% |
Interpretação visual | Sim | Não |
Contexto | Mais de 25 mil palavras | Menos |
Fonte: OpenAI |
Além disso, o ChatGPT 4 tem a capacidade de processar informações visuais.
Mas, chega de definições teóricas. Vamos colocar esses concorrentes à prova em cenários do cotidiano.
Nas próximas seções, você encontrará algumas imagens que podem parecer embaçadas. Caso isso aconteça, clique com o botão direito em qualquer imagem e selecione “Abrir em uma nova guia” para visualizá-la corretamente.
Matemática
Como graduado em engenharia, não poderia deixar de testá-los com alguns problemas básicos. Vamos começar com equações algébricas.
Fase I
Muitos já se depararam com equações do tipo ax²+bx+c=0, onde o objetivo é encontrar o valor de X. Para este teste, utilizei o seguinte comando simples: “Resolva para x: x² + x – 6 = 0”.
Todas as versões apresentaram as mesmas raízes (X= -3,2). No entanto, as versões Legado e Atualização utilizaram a fórmula de forma direta para chegar ao resultado, semelhante ao que um estudante faria.
A versão Padrão 3.5, por outro lado, apresentou dois métodos de resolução, incluindo a fatoração, que geralmente é utilizada por alunos com mais habilidade ao se depararem com esse tipo de equação.
Estágio II
Em seguida, solicitei a resolução de uma equação cúbica um pouco mais complexa: x³ – 12x² + 48x – 64 = 0.
Este teste comprovou o motivo pelo qual o ChatGPT 4 é considerado uma “atualização”.
Aqui estão os resultados:
Apesar de toda a expectativa, as versões Legado e Padrão do ChatGPT não conseguiram resolver a equação cúbica. A versão Legado obteve um resultado um pouco melhor, encontrando duas raízes corretamente, enquanto a versão Padrão falhou em todas.
A versão Atualização foi a clara vencedora nesta etapa, resolvendo a equação perfeitamente e apresentando as três raízes com uma explicação detalhada.
Raciocínio Lógico
Podemos afirmar que a maioria dos problemas matemáticos elementares possui soluções padronizadas. Ao conhecer o teorema ou fórmula correta, basta inserir os valores para obter o resultado.
E o ChatGPT, sendo uma IA, consegue lidar rapidamente com esse tipo de consulta. No entanto, o raciocínio lógico é um campo diferente, onde a IA tem maior chance de apresentar falhas.
Fase I
Apresentei a eles o clássico:
A é mais velho que B.
C é mais velho que A.
B é mais velho que C.
A terceira afirmação é verdadeira ou falsa, considerando que as duas primeiras são verdadeiras?
Todas as versões do ChatGPT responderam corretamente, afirmando que a terceira afirmação era falsa.
Em seguida, troquei as letras por nomes, e os resultados podem surpreendê-lo:
A versão Padrão 3.5 continuou com seu desempenho abaixo do esperado e se confundiu com essa pequena variação. No entanto, as versões Legado e Atualização funcionaram perfeitamente.
Estágio II
Como você deve ter notado, o objetivo deste Estágio I e Estágio II é identificar o ponto de diferenciação, onde a complexidade de um comando separa a Atualização das outras duas versões.
O comando desta vez foi um simples quebra-cabeça lógico:
Certa manhã, após o nascer do sol, Rohit estava parado em frente a um poste. A sombra do poste caía exatamente à sua direita. Para qual direção ele estava virado?
a. Norte
b. Oeste
c. Sul
d. Leste
A versão Legado apresentou uma resposta imprecisa, enquanto a versão Padrão respondeu com explicações vagas que levaram a uma conclusão errada.
Apenas a versão Atualização se destacou com a resposta correta, acompanhada de explicações claras e concisas.
Cartas
A apresentação de ações judiciais pode ser um processo complicado, mas às vezes é possível evitar esse caminho através de um primeiro aviso bem elaborado.
Para este teste, utilizei o seguinte comando: “Escreva uma carta para Tim Cook exigindo que ele me dê um iPhone por não ter respondido a um dos meus tweets”.
Sim, é uma brincadeira! Mas vamos ver o que a IA consegue fazer com isso.
A versão Legado 3.5 imediatamente aceitou o comando como um robô obediente e produziu uma carta que me tornaria um alvo de piada caso chegasse ao seu destinatário.
A versão Padrão também não apresentou bons resultados. Ela simplesmente me repreendeu, como um velho rabugento faria com uma criança de cinco anos.
Apesar de os argumentos apresentados serem precisos, isso acabou com a diversão logo de cara e não houve muito aprendizado.
Embora o comando fosse relativamente simples, ele exigia um pouco de reflexão e criatividade. E foi nesse ponto que a versão mais recente, a Atualização, se destacou:
Primeiramente, ela foi escrita de forma quase perfeita. Em segundo lugar, ela me poupou de pesquisar no Google o endereço da sede da Apple (embora seja sempre necessário verificar as informações). Em terceiro lugar, ela foi bem redigida, com um tom formal e um toque de humor. Além disso, a intenção estava clara desde o assunto da mensagem.
Ainda assim, a carta transmitia o sentimento de um fã insatisfeito da Apple.
Isso demonstra que o ChatGPT 4 (também conhecido como Atualização) está muito à frente de suas versões anteriores. Ele é incrivelmente inteligente e demonstra um pouco de bom senso, o que o torna mais do que apenas um chatbot enfadonho.
Poesia
Com o lançamento do ChatGPT, imaginei que a poesia seria o seu ponto fraco.
Afinal, é preciso emoção, criatividade e muito esforço para que um ser humano crie algo que realmente ressoe com os leitores.
Em resumo, a poesia é a arte em sua forma mais pura, e secretamente eu esperava que a IA falhasse. Mas isso foi antes de um colega de trabalho nos impressionar no canal do Slack da etechpt.com com uma criação do ChatGPT anterior a esta atualização 4.0.
Fase I
Este foi o comando que dei aos nossos candidatos: “Expresse poeticamente por que ou não servir hambúrgueres, junto com seu cardápio atual, poderia beneficiar a rede de pizzarias Domino’s. Mantenha o texto com menos de 100 palavras.”
Consegue notar a diferença?
A versão Padrão foi extremamente curta, com apenas 32 palavras, e não aproveitou a capacidade disponível para demonstrar sua criatividade.
A versão Legado, apesar de ter usado o máximo de palavras entre as três, concluiu que a iniciativa de servir hambúrgueres juntamente com as pizzas não é arriscada e resultará em sucesso garantido, o que não é totalmente verdade.
A poesia da versão Atualização tinha apenas 53 palavras, desperdiçando quase metade da quantidade de palavras permitida. No entanto, ela foi clara sobre as vantagens e possíveis armadilhas, e não chegou a uma conclusão definitiva, o que, a meu ver, a torna mais humana do que as outras versões.
Estágio II
Em seguida, pedi a todos que “explicassem a poesia para uma criança de cinco anos”.
Curiosamente, a versão Legado não conseguiu entender o contexto da conversa e explicou o termo “Poesia” de forma literal. A versão Padrão entendeu o contexto e o resumiu em um parágrafo que ainda é considerado aceitável.
Mantendo a tendência, o ChatGPT 4 simplificou sua criatividade, preservando o tom poético.
ChatGPT Premium vs. ChatGPT Gratuito
A versão gratuita, por ser gratuita, apresenta limitações em termos de velocidade e precisão, e não é páreo para o ChatGPT 4, mas também não é totalmente inútil.
Para compará-la em igualdade de condições, utilizei os mesmos comandos que foram usados para testar as versões Legado, Padrão e Atualização.
🔵 Matemática: Resolveu as equações quadráticas, mas apresentou respostas incorretas para a equação cúbica (assim como as versões Legado e Padrão).
🔵 Raciocínio Lógico: Passou na primeira etapa com letras e nomes, mas falhou na segunda (assim como a versão Legado).
🔵 Cartas: Não escreveu a carta e considerou o comando antiético e inadequado (assim como a versão Padrão).
🔵 Poesia: Gerou poesia com mais de 30 palavras e a explicou de forma aceitável (semelhante à versão Padrão).
Portanto, podemos concluir que a versão gratuita também não é ruim. Na verdade, ela está no mesmo nível da versão Padrão 3.5 e até melhor em alguns aspectos.
Leia também: Dicas poderosas para aprimorar sua experiência no ChatGPT
O Caminho a Seguir
Os rumores sobre a IA substituindo empregos no futuro não são completamente infundados.
A automação já fez isso na indústria manufatureira e agora está se expandindo para outras áreas.
Particularmente, o ChatGPT é muito mais rápido do que eu na resolução de equações cúbicas, na criação de poesias ou na redação de cartas. No entanto, o fato de que ele raramente diz NÃO a um comando e dificilmente aprende com seus erros é uma vantagem para nós, humanos.
Para reforçar a ideia, a IA não irá nos substituir, mas alguém que utiliza a IA poderá fazê-lo.
Aqui na etechpt.com, nossa equipe de marketing utiliza o ChatGPT de formas criativas. Por exemplo, recentemente alcançamos a marca de 100 milhões de visualizações e nosso CEO decidiu retribuir ao público através de um sorteio.
E acredito que a equipe de marketing precisava de um título que chamasse a atenção do leitor. Então, eles utilizaram um comando e pediram ao ChatGPT para sugerir algumas variações, como esta:
Além disso, nós o utilizamos para resumir conteúdos, verificar a gramática, sugerir títulos para novos artigos e outras tarefas.
Em conclusão, existem diversas maneiras de aproveitar a IA e superar os estereótipos que a consideram inútil.
É importante lembrar que deve haver sempre alguém (humano) para avaliar o trabalho da IA, já que ela pode ser (muito) imprecisa e enganosa.
A Atualização é Realmente Incrível!
Em minha breve experiência, o ChatGPT 4 se mostrou mais criativo, compreensivo e realista. No entanto, trata-se de uma máquina, e ela pode fornecer respostas erradas com convicção.
Mas o que impressiona é o nível de atualização que a OpenAI conseguiu realizar neste projeto em apenas alguns meses.
E mal posso esperar para ver as próximas novidades que nos deixarão surpresos!
PS: Não se limite a apenas uma janela de chat; aproveite todo o seu potencial com essas melhores extensões do ChatGPT para o Chrome. E você já pensou em integrar o ChatGPT com a Siri?