A Anthropic anunciou ontem, 24 de novembro de 2025, a disponibilidade geral do Claude Opus 4.5, o seu modelo de inteligência artificial mais sofisticado até à data. O lançamento representa um grande avanço na capacidade dos sistemas de IA para executarem tarefas de engenharia de software do mundo real, operarem agentes autónomos e utilizarem computadores de forma independente.
O novo modelo destaca-se pela performance bruta, pela introdução de mecanismos de controlo granular para programadores e por uma estrutura de custos revista para democratizar o acesso a capacidades de raciocínio de fronteira.
Claude Opus 4.5: superação da competência humana em engenharia de software
A Anthropic submeteu o Claude Opus 4.5 a um rigoroso teste interno: o mesmo exame técnico (“take-home exam”) utilizado no processo de recrutamento para engenheiros de performance da empresa. O resultado surpreendeu: dentro do limite de tempo de duas horas, o modelo obteve uma pontuação superior à de qualquer candidato humano que alguma vez realizou o teste.
Este desempenho reflete-se nos benchmarks públicos. O Opus 4.5 atingiu o estado da arte no SWE-bench Verified, liderando em 7 das 8 linguagens de programação avaliadas no SWE-bench Multilingual. A empresa destaca que o modelo exibe uma capacidade superior para lidar com a ambiguidade, raciocinar sobre compromissos técnicos (trade-offs) sem orientação e corrigir bugs complexos que atravessam múltiplos sistemas.
O novo “Parâmetro de Esforço”: controlo sobre o raciocínio
Uma das principais novidades técnicas para os programadores é a introdução do “parâmetro de esforço” (effort parameter) na API do Claude. A funcionalidade permite aos utilizadores decidirem como o modelo aloca os recursos computacionais para uma tarefa.
- Esforço Médio: Iguala a melhor pontuação do modelo anterior (Sonnet 4.5) no SWE-bench Verified, mas utiliza 76% menos tokens de saída, o que garante rapidez e eficiência.
- Esforço Alto: Maximiza a capacidade de raciocínio do modelo. Neste nível, o Opus 4.5 supera a performance do Sonnet 4.5 em 4,3 pontos percentuais, mantendo ainda assim uma redução de 48% no uso de tokens.
Esta flexibilidade permite que as equipas de engenharia ajustem o comportamento do modelo — entre respostas rápidas e deliberação profunda — dependendo da urgência ou complexidade da tarefa.
Capacidades Agênticas e ‘Claude Code’
O lançamento traz atualizações importantes à plataforma de desenvolvimento, focadas na construção de sistemas multi-agente complexos. O Claude Opus 4.5.5 demonstra eficácia na gestão de equipas de sub-agentes, uma arquitetura que, nos testes da Anthropic, aumentou a performance em avaliações de pesquisa profunda em quase 15 pontos percentuais.
A ferramenta “Claude Code” também foi melhorada:
- Plan Mode: O modelo realiza perguntas de clarificação iniciais e constrói um plano detalhado (ficheiro plan.md editável pelo utilizador) antes de executar qualquer código, para garantir um alinhamento preciso com os objetivos do programador.
- Execução Paralela: A aplicação de desktop suporta agora múltiplas sessões locais e remotas em simultâneo. Isto permite, por exemplo, ter um agente a corrigir bugs enquanto outro pesquisa documentação no GitHub.
Estrutura de preços e acessibilidade
Historicamente, os modelos da classe “Opus” apresentavam custos proibitivos para muitas aplicações. A Anthropic alterou esta dinâmica com o Claude Opus 4.5, fixando o preço em 5 dólares por milhão de tokens de entrada e 25 dólares por milhão de tokens de saída.
Esta redução de preço, combinada com a maior eficiência do modelo (que requer menos passos e backtracking para resolver problemas), facilita o uso de inteligência de ponta em fluxos de trabalho diários e em larga escala.
Segurança e robustez
A par das capacidades ofensivas, a Anthropic reforçou as defesas do modelo. O Claude Opus 4.5 é classificado pela empresa como o seu modelo mais robusto até à data.
Em testes de segurança desenvolvidos pela Gray Swan, o modelo demonstrou ser mais resistente a ataques de injeção de prompt (tentativas de enganar a IA para realizar ações maliciosas) do que qualquer outro modelo de fronteira da indústria. Esta resistência é essencial para clientes empresariais que integram o Claude em fluxos de trabalho sensíveis e expostos a inputs externos.
Conclusão
O Claude Opus 4.5, anunciado ontem, representa mais do que uma evolução incremental na linha de produtos da Anthropic, estabelece um novo padrão para a utilidade da IA na engenharia de software. Ao combinar uma capacidade de raciocínio que rivaliza com especialistas humanos, ferramentas de controlo granular como o parâmetro de esforço e uma estrutura de custos acessível, o modelo posiciona-se como uma infraestrutura a ter em conta para a próxima geração de desenvolvimento de software assistido por agentes.
Outros artigos interessantes:
