Inteligência Artificial

Claude Sonnet 4.5: o salto da Anthropic é suficiente para liderar a corrida da IA?

Novo modelo Claude Sonnet 4.5 promete ser o mais avançado para programação, mas dados mostram um cenário mais disputado

Anthropic: A empresa de tecnologia é a criadora do modelo de linguagem Claude, concorrente do ChatGPT (Smith Collection/Gado/Getty Images)

Anthropic: A empresa de tecnologia é a criadora do modelo de linguagem Claude, concorrente do ChatGPT (Smith Collection/Gado/Getty Images)

André Lopes
André Lopes

Repórter

Publicado em 29 de setembro de 2025 às 17h02.

 

Na corrida pelo próximo grande modelo de inteligência artificial, a americana Anthropic anunciou nesta segunda-feira, 29, o lançamento do Claude Sonnet 4.5, descrito pela empresa como o salto mais confiável já dado em tarefas de programação.

O modelo, disponível na API da companhia e no chatbot Claude, tem o mesmo preço de sua versão anterior — US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de saída. A promessa é ambiciosa: segundo a Anthropic, o Claude Sonnet 4.5 não apenas gera protótipos, mas pode construir aplicações “prontas para produção”.

Em testes com empresas parceiras, a IA teria conseguido codar de forma autônoma por até 30 horas seguidas, criando bancos de dados, comprando domínios e até conduzindo auditorias de segurança.

A Anthropic afirma que o modelo entrega performance de ponta em benchmarks de programação, como o SWE-Bench Verified, usado por pesquisadores para medir a capacidade de IAs resolverem problemas complexos de software.

CEOs de startups que usam Claude, como Cursor e Windsurf, reforçaram em comunicados que o Sonnet 4.5 representa uma “nova geração de modelos de programação”.

 

Mas os números contam uma história menos absoluta. Nos últimos meses, o GPT-5, da OpenAI, superou modelos da Anthropic em uma série de testes de engenharia de software. A disputa entre empresas tornou-se tão acirrada que dificilmente qualquer lançamento mantém liderança clara por mais de algumas semanas.

O que muda para desenvolvedores

O anúncio não trouxe apenas o modelo. A Anthropic lançou também o Claude Agent SDK, kit que permite a desenvolvedores criarem seus próprios agentes autônomos — infraestrutura usada internamente no Claude Code. Para assinantes da versão Max, haverá ainda um preview experimental chamado Imagine with Claude, que mostra o modelo escrevendo software em tempo real, sem funções pré-determinadas.

Esses recursos refletem uma tendência mais ampla: as IAs estão deixando de ser apenas ferramentas de apoio e começam a assumir papéis de agentes, capazes de executar cadeias inteiras de tarefas de forma autônoma.

A Anthropic também diz ter avançado em outro ponto sensível: a “alinhamento” dos modelos. O Sonnet 4.5 teria taxas menores de bajulação (sycophancy), de respostas enganosas e de vulnerabilidade a ataques de injeção de prompt. Em um mercado no qual falhas de segurança podem comprometer empresas inteiras, esse tipo de promessa pode pesar tanto quanto a velocidade ou a precisão do código gerado.

Competição sem trégua

O Sonnet 4.5 chega menos de dois meses após o lançamento do Claude Opus 4.1. A cadência acelerada — típica também de rivais como a OpenAI e o Google DeepMind — mostra que a disputa está menos em “quem tem a melhor IA” e mais em “quem consegue manter a frente por mais tempo”.

No fim, a pergunta central permanece: Claude Sonnet 4.5 é realmente a melhor IA do mercado? Nos benchmarks, pode até estar no topo. Mas, na prática, o cenário é mais volátil — e para desenvolvedores e empresas, o que importa será menos o pódio e mais a confiabilidade no dia a dia.

Acompanhe tudo sobre:Inteligência artificial

Mais de Inteligência Artificial

O que há por trás do ChatGPT? Entenda como funcionam o treinamento do chatbot

MIT desenvolve sistema de IA capaz de acelerar descoberta de novos materiais

OpenAI lança ferramentas de controle parental no ChatGPT para adolescentes

IA acelera Judiciário no Brasil: juízes encerram mais ações, advogados protocolam mais casos