Por que a IA do Google não consegue soletrar 'Google'
A IA do Google travou em uma tarefa que qualquer criança alfabetizada resolve: soletrar. Questionado sobre quantos Ps existem em "Google", o AI Overview — o resumo gerado por inteligência artificial no topo das buscas — respondeu que são dois. O caso foi apontado por um usuário do X (antigo Twitter) na quarta-feira, 27, e rapidamente viralizou.
Não é um deslize isolado, nem exclusivo do Google. É um sintoma de como funcionam os grandes modelos de linguagem (LLMs) — as IAs que alimentam chatbots e geradores de texto. É uma piada recorrente há anos pedir a cada novo modelo de IA que diga quantos "Rs" há na palavra "strawberry" (morango, em inglês); a resposta costuma sair errada.
Quais erros de soletração a IA do Google cometeu?
Além do próprio nome, o AI Overview acumulou outros tropeços documentados por usuários:
Afirmou que a palavra da língua inglesa "poop" tem exatamente um R (não tem nenhum).
Os problemas do AI Overview vão além da soletração: na semana passada, o Google corrigiu uma falha em que buscar a palavra "disregard" retornava o que parecia uma definição de dicionário, mas trazia a frase "Entendido. Me avise quando tiver um novo prompt".
Por que a IA não consegue soletrar?
A explicação está na arquitetura. Segundo Matthew Guzdial, pesquisador de IA e professor da Universidade de Alberta, os LLMs se baseiam na arquitetura transformer, que não lê o texto de fato: o prompt é convertido em uma codificação. Quando o modelo vê a palavra "the", ele tem uma codificação do que "the" significa, mas não enxerga as letras "T", "H", "E" separadamente.
Na prática, a IA não opera com letras nem palavras como unidade, e sim com tokens — fragmentos que podem ser uma palavra inteira, uma sílaba ou um pedaço de letra, dependendo do modelo. Por isso ela entende o sentido de "Google", mas não "vê" a sequência de letras que o forma.
O Google vai corrigir o problema?
A empresa reconheceu a falha. Em comunicado por e-mail ao TechCrunch, o Google afirmou que contar dentro das palavras tem sido um desafio conhecido para os LLMs e que está trabalhando para resolver esse problema específico.
Os pesquisadores, porém, não são otimistas quanto a uma solução definitiva. Segundo Sheridan Feucht, doutorando em interpretabilidade de modelos de linguagem na Northeastern University, é difícil sequer definir o que uma "palavra" deveria ser para um modelo — e, mesmo com um vocabulário de tokens perfeito, os modelos ainda tenderiam a fragmentar essas unidades em partes menores.
A boa notícia para o Google é que a utilidade dessas ferramentas raramente depende da capacidade de soletrar — daí o problema não ser tratado como urgente pelos desenvolvedores. A má notícia é de imagem: não era preciso ser profeta para prever tropeços na reformulação da Busca em torno da IA, já que na primeira vez que o Google adicionou os AI Overviews, em 2024, a ferramenta citou posts satíricos de The Onion e do Reddit e chegou a recomendar comer pedras e colocar cola na pizza. O episódio reacende as dúvidas sobre apostar a IA generativa no centro de um produto que é a vitrine da empresa há quase três décadas.
Por que a IA também erra ao escrever texto em imagens
A mesma limitação aparece nos geradores de imagem, como os de Gemini e ChatGPT, e tem gerado reclamações de quem tenta usá-los para design. A IA costuma render bem em elementos como carros e rostos, mas escorrega na escrita dentro das imagens — e, classicamente, nas mãos.
Em 2024, viralizou um vídeo mostrando a maratona de prompts que um usuário precisou para fazer o ChatGPT gerar uma arte com a palavra "Honda": na primeira tentativa, o chatbot entregou "Chu". A lógica é parecida: o modelo é incentivado a produzir algo parecido com os dados de treino, mas não domina regras óbvias para humanos, como a grafia de palavras simples. No caso das mãos, os engenheiros podem ampliar o volume de exemplos de como uma mão deve ser; com a escrita, o desafio é maior, porque ainda precisa dar conta de diferentes idiomas.
Nenhum comentário disponível no momento.
Comentários
Deixe seu comentário abaixo: