Pedimos a uma IA para criticar outra IA — o resultado foi surpreendente

Por Denise Gabrielle 7 de Junho de 2026 👁️ 0 visualizações 💬 0 comentários
Pedimos a uma IA para criticar outra IA — o resultado foi surpreendente

O experimento foi simples: a Exame pediu ao ChatGPT que analisasse o Claude, ao Claude que fizesse uma avaliação crítica do ChatGPT e ao Gemini que comparasse os dois concorrentes.

O resultado foi menos uma troca de ataques e mais uma sessão de avaliação de desempenho corporativa. Nenhuma das plataformas declarou guerra às demais.

Pelo contrário: as três reconheceram qualidades dos concorrentes, apontaram limitações reais e, curiosamente, chegaram a conclusões bastante parecidas sobre os pontos fortes e fracos de cada sistema.

Todo mundo fala de IA — poucos sabem por onde começar. O pré-MBA EXAME + Saint Paul ensina em 4 aulas, online, por R$37. Comece hoje. Vagas abertas.

Quando o ChatGPT criticou o Claude

A avaliação feita pelo ChatGPT chamou atenção pelo equilíbrio entre elogios e ressalvas. Segundo a ferramenta, o principal diferencial do Claude está na capacidade de lidar com grandes volumes de informação e produzir textos sofisticados.

O ChatGPT destacou que o concorrente costuma se sair bem em tarefas de leitura, análise de documentos extensos e produção textual mais refinada.

Também apontou uma característica curiosa: a tendência do Claude de questionar premissas antes de responder, algo que pode ser útil em pesquisas e análises estratégicas.

Mas nem tudo recebeu elogios. O ChatGPT afirmou que a reputação do Claude às vezes é superestimada e lembrou que a ferramenta continua sujeita aos mesmos problemas observados em outros modelos de linguagem, incluindo informações incorretas apresentadas com grande confiança.

A crítica mais dura veio em relação ao ecossistema. Na visão do ChatGPT, o Claude ainda oferece menos integrações e recursos complementares do que alguns concorrentes.

Aprenda IA do zero com EXAME + Saint Paul: pré-MBA online (4 aulas) por R$37. Ideal pra quem quer começar e não sabe como. Matrículas abertas.

O Claude avaliou o ChatGPT

O Claude adotou uma abordagem quase acadêmica para analisar o ChatGPT. Entre os pontos positivos, destacou a versatilidade, a fluência das respostas e a capacidade de aumentar a produtividade em diferentes tipos de trabalho.

Segundo a avaliação, o ChatGPT se tornou uma ferramenta extremamente acessível para tarefas de escrita, pesquisa preliminar e apoio profissional.

As críticas, porém, foram bastante diretas. O Claude apontou problemas relacionados a alucinações, inconsistências factuais e excesso de verbosidade em algumas respostas.

Outro aspecto levantado foi a dificuldade de explicar como determinadas conclusões são produzidas, um desafio que não afeta apenas o ChatGPT, mas boa parte dos modelos de linguagem atuais.

Em um trecho particularmente interessante, o Claude observou que o uso eficiente dessas ferramentas exige usuários capazes de verificar informações e exercer pensamento crítico — uma observação que poderia facilmente servir para qualquer IA do mercado.

Quer entender IA na prática? EXAME + Saint Paul criaram um pré-MBA com 4 aulas online por R$37. Comece do zero e dê o primeiro passo agora.

E o que Gemini acha de outras IAs?

Em vez de escolher um vencedor, o Gemini decidiu posicionar cada ferramenta em um papel diferente. Na sua avaliação, o ChatGPT funciona como um "canivete suíço digital": rápido, multifuncional e forte em multimodalidade, combinando texto, imagem, voz e análise de dados.

Já o Claude foi descrito como um "consultor especialista", com destaque para escrita mais natural, interpretação de nuances e análise de documentos extensos.

A comparação talvez tenha produzido a frase mais interessante de todo o experimento. Enquanto o ChatGPT foi apresentado como uma ferramenta capaz de fazer muitas coisas com eficiência, o Claude apareceu como uma opção voltada para profundidade e raciocínio mais elaborado.

Apesar do tom descontraído da proposta, as respostas revelaram algo curioso: as três plataformas parecem ter uma visão relativamente alinhada sobre o estado atual da inteligência artificial.

Nenhuma delas se apresentou como perfeita. Todas reconheceram limitações relacionadas a erros factuais, necessidade de verificação humana e desafios de confiabilidade. Ao mesmo tempo, cada uma destacou competências diferentes como forma de justificar sua relevância no mercado.

Talvez a maior surpresa não tenha sido descobrir qual IA é melhor. Foi perceber que, quando convidadas a avaliar os concorrentes, elas chegaram a um consenso raro na tecnologia: não existe uma ferramenta ideal para tudo. Pelo menos por enquanto.

Comentários

Deixe seu comentário abaixo: