Na segunda-feira, a Anthropic anunciou o Opus 4.5, a versão mais recente de seu modelo carro-chefe. É o último modelo da série 4.5 da Anthropic a ser lançado, após o lançamento do Sonnet 4.5 em setembro e do Haiku 4.5 em outubro.

Como esperado, a nova versão do Opus tem desempenho de última geração em uma variedade de benchmarks, incluindo benchmarks de codificação (SWE-Bench e Terminal-bench), uso de ferramentas (tau2-bench e MCP Atlas) e resolução geral de problemas (ARC-AGI 2, GPQA Diamond).

Notavelmente, o Opus 4.5 é o primeiro modelo a pontuar mais de 80% no SWE-Bench verificado, um benchmark de codificação respeitado.

A Anthropic também enfatizou o uso do computador e os recursos de planilhas do Opus, e lançou uma série de produtos paralelos para mostrar como o modelo se comporta nesses ambientes. Juntamente com o Opus 4.5, a Anthropic fará a sua Claude para Chrome e Cláudio para Excel produtos – anteriormente em fase piloto – mais amplamente disponíveis. A extensão do Chrome estará disponível para todos os usuários do Max, enquanto o modelo focado no Excel estará disponível para usuários do Max, Team e Enterprise.

O Opus 4.5 também vem com melhorias de memória para operações de contexto longo, o que exigiu mudanças significativas na forma como o modelo gerencia sua memória.

“Fizemos melhorias na qualidade geral do contexto longo no treinamento com o Opus 4.5, mas as janelas de contexto não serão suficientes por si só”, disse Dianne Na Penn, chefe de gerenciamento de produtos para pesquisa da Anthropic, ao TechCrunch. “Saber os detalhes certos para lembrar é muito importante, além de ter apenas uma janela de contexto mais longa.”

Essas mudanças também permitiram um recurso de “bate-papo sem fim” há muito solicitado para usuários pagos do Claude, que permitirá que os bate-papos continuem sem interrupção quando o modelo atingir sua janela de contexto. Em vez disso, o modelo compactará sua memória de contexto sem alertar o usuário.

Evento Techcrunch

São Francisco
|
13 a 15 de outubro de 2026

Muitas das atualizações são feitas visando casos de uso de agentes, especialmente cenários em que o Opus atua como agente líder comandando um grupo de subagentes movidos por Haiku. Gerenciar essas tarefas requer um forte domínio da memória de trabalho, e é aí que as melhorias de memória descritas por Penn realmente mostram seu valor.

“É aqui que fundamentos como a memória se tornam realmente importantes”, diz Penn, “porque Claude precisa ser capaz de explorar bases de código e documentos grandes, e também saber quando voltar atrás e verificar novamente algo”.

O Opus 4.5 enfrentará forte concorrência de outros modelos de fronteira lançados recentemente, mais notavelmente o GPT 5.1 da OpenAI (lançado em 12 de novembro) e o Gemini 3 do Google (lançado em 18 de novembro).