Índice
Uma das primeiras perguntas ao usar o Claude é: "Devo usar o Opus, o Sonnet ou o Haiku?"
Os três modelos diferem em até 5x no preço da API, com diferenças claras de desempenho. Mas o modelo mais caro nem sempre é a melhor escolha. O Haiku pode ser mais prático para certas tarefas, enquanto outras realmente exigem o Opus.
Este artigo compara os preços, desempenho e velocidade mais recentes (abril de 2026), com estimativas de custo por tarefa para ajudar na sua decisão.
1. Os Três Modelos em Resumo
| Modelo | Posicionamento | Lançamento | Resumo |
|---|---|---|---|
| Opus 4.6 | Modelo principal | Fev 2026 | O mais inteligente. Para agentes e programação complexa |
| Sonnet 4.6 | Equilibrado | Fev 2026 | Melhor equilíbrio entre velocidade e inteligência. Ideal para uso diário |
| Haiku 4.5 | Rápido e Acessível | Out 2025 | O mais rápido. Para tarefas em grande volume e em tempo real |
Os nomes refletem o tamanho das formas literárias. Um opus (uma grande obra) representa o pensamento mais profundo, um soneto (poema de 14 versos) oferece profundidade equilibrada, e um haiku (poema de 3 versos) entrega respostas rápidas e concisas.
2. Comparação de Preços da API
Preços Padrão (por Milhão de Tokens)
| Modelo | Entrada | Saída | Lote Entrada | Lote Saída | Cache Hit |
|---|---|---|---|---|---|
| Opus 4.6 | US$5 | US$25 | US$2,50 | US$12,50 | US$0,50 |
| Sonnet 4.6 | US$3 | US$15 | US$1,50 | US$7,50 | US$0,30 |
| Haiku 4.5 | US$1 | US$5 | US$0,50 | US$2,50 | US$0,10 |
A diferença entre o mais caro (saída do Opus a US$25/MTok) e o mais barato (saída do Haiku a US$5/MTok) é de 5x. Porém, o Opus 4.6 é na verdade 3x mais barato que seu antecessor (o Opus 4.1 custava US$75/MTok).
Dicas para Reduzir Custos
A API de Lote reduz os custos pela metade, e os cache hits diminuem o custo de entrada para 1/10. Combinando ambos, é possível alcançar até 95% de economia. Se você faz processamento em grande volume, explore essas opções primeiro.
O Que É um "Token"?
O preço da API é baseado em "tokens". Em inglês, aproximadamente 1 palavra ≈ 1,3 tokens. Um milhão de tokens equivale a cerca de 750.000 palavras — aproximadamente 10 romances de tamanho médio.
3. Planos de Assinatura
As assinaturas mensais oferecem uma estrutura de preços fundamentalmente diferente do modelo pago por uso da API.
| Plano | Preço | Modelos Disponíveis | Padrão |
|---|---|---|---|
| Gratuito | US$0 | Apenas Sonnet 4.5 | Sonnet 4.5 |
| Pro | US$20/mês | Todos os modelos | Sonnet 4.6 |
| Max 5x | US$100/mês | Todos os modelos | Opus 4.6 |
| Max 20x | US$200/mês | Todos os modelos | Opus 4.6 |
As assinaturas não são "ilimitadas", mas possuem limites de uso. Ainda assim, são 15 a 30 vezes mais baratas que os preços da API. Um usuário relatou ter consumido 10 bilhões de tokens em 8 meses — pelas tarifas da API, isso custaria mais de US$15.000, mas sua assinatura Max custou cerca de US$800.
Trocando de Modelo no Claude Code
No Claude Code, você pode trocar de modelo ao iniciar com claude --model opus ou claude --model sonnet, ou durante a sessão com /model sonnet. O plano Pro usa Sonnet por padrão, e o Max usa Opus. Para mais detalhes sobre o Claude Code, veja Claude Chat vs. Cowork vs. Code.
4. Benchmarks de Desempenho
| Benchmark | O Que Mede | Opus 4.6 | Sonnet 4.6 | Diferença |
|---|---|---|---|---|
| SWE-bench Verified | Capacidade de programação | 80,8% | 79,6% | Apenas 1,2pts |
| GPQA Diamond | Raciocínio científico | 91,3% | 74,1% | 17,2pts |
| OSWorld-Verified | Automação de GUI | 72,7% | 72,5% | Praticamente igual |
| Math | Problemas matemáticos | — | 89% | — |
O dado mais relevante: a diferença de desempenho em programação é de apenas 1,2 pontos. O Sonnet 4.6 é o primeiro Sonnet na história do Claude a igualar o Opus da geração anterior em benchmarks de código.
No entanto, o raciocínio científico (GPQA Diamond) apresenta uma diferença de 17,2 pontos, tornando o Opus claramente superior para análises acadêmicas e raciocínio lógico complexo.
Os benchmarks oficiais do Haiku 4.5 são limitados, mas a Anthropic o posiciona como tendo "inteligência próxima à fronteira". Para tarefas simples, espera-se que se aproxime da precisão do Sonnet.
5. Velocidade e Janelas de Contexto
| Modelo | Velocidade (aprox.) | Janela de Contexto | Saída Máxima |
|---|---|---|---|
| Opus 4.6 | ~20–30 tok/seg | 1M tokens | 128K tokens |
| Sonnet 4.6 | ~40–60 tok/seg | 1M tokens | 64K tokens |
| Haiku 4.5 | 2–5x mais rápido que o Sonnet | 200K tokens | 64K tokens |
O grande trunfo do Haiku é a velocidade. Ele possui o menor tempo até o primeiro token (TTFT), sendo ideal para chatbots em tempo real e recursos de autocomplete.
O Opus oferece uma janela de contexto de 1 milhão de tokens (aproximadamente 10 a 20 romances) para tarefas como processar bases de código inteiras de uma só vez. Sua saída máxima de 128K tokens é o dobro do Sonnet/Haiku, ideal para gerar documentos longos em uma única chamada.
6. Estimativas de Custo por Caso de Uso
Veja quanto custam tarefas típicas com preços padrão da API (sem cache ou lote).
Cenário 1: Gerar um artigo de 2.000 palavras
Entrada: ~1.000 tokens, Saída: ~2.700 tokens
| Modelo | Custo Entrada | Custo Saída | Total |
|---|---|---|---|
| Opus 4.6 | US$0,005 | US$0,068 | ~US$0,07 |
| Sonnet 4.6 | US$0,003 | US$0,041 | ~US$0,04 |
| Haiku 4.5 | US$0,001 | US$0,014 | ~US$0,02 |
Cenário 2: Ler um arquivo de código e refatorar
Entrada: ~10.000 tokens (código + instruções), Saída: ~5.000 tokens
| Modelo | Custo Entrada | Custo Saída | Total |
|---|---|---|---|
| Opus 4.6 | US$0,05 | US$0,125 | ~US$0,18 |
| Sonnet 4.6 | US$0,03 | US$0,075 | ~US$0,11 |
| Haiku 4.5 | US$0,01 | US$0,025 | ~US$0,04 |
Cenário 3: Chatbot atendendo 1.000 consultas/dia
200 tokens de entrada + 300 tokens de saída por consulta × 1.000
| Modelo | Custo Diário | Mensal (30 dias) |
|---|---|---|
| Opus 4.6 | US$8,50 | US$255 |
| Sonnet 4.6 | US$5,10 | US$153 |
| Haiku 4.5 | US$1,70 | US$51 |
Para cenários de alto volume como chatbots, a diferença mensal entre Haiku e Opus ultrapassa US$200. Uma abordagem prática é usar o Haiku como padrão e direcionar apenas consultas complexas para o Sonnet ou Opus.
7. Qual Modelo Escolher?
| Caso de Uso | Recomendado | Por quê |
|---|---|---|
| Programação e escrita diária | Sonnet 4.6 | 98% da qualidade do Opus em código, 40% mais barato, 2x mais rápido |
| Refatoração em larga escala | Opus 4.6 | Janela de 1M de contexto e 128K de saída fazem diferença |
| Análise acadêmica | Opus 4.6 | 17 pontos de diferença no GPQA. Raciocínio profundo não tem substituto |
| Chatbots e suporte | Haiku 4.5 | O mais rápido + mais barato. Perfeito para respostas padrão |
| Processamento em lote | Haiku 4.5 | 1/5 do custo, lida com volume eficientemente |
| Desenvolvimento com Claude Code | Sonnet 4.6 | O plano Pro é suficiente. Use Opus apenas para arquitetura complexa |
Conselho Prático
Na dúvida, comece com o Sonnet. Ele dá conta da maioria das tarefas. Só passe para o Opus quando a qualidade do Sonnet não for suficiente, e use o Haiku para tarefas simples e repetitivas. Essa abordagem em camadas oferece o melhor custo-benefício.
FAQ
Qual a diferença de desempenho em programação entre Opus e Sonnet?
No SWE-bench Verified (benchmark de programação), o Opus 4.6 marca 80,8% e o Sonnet 4.6 marca 79,6% — uma diferença de apenas 1,2 pontos. No dia a dia da programação, a diferença é quase imperceptível. Considerando a diferença de custo (US$25 vs US$15/MTok para saída), o Sonnet oferece melhor custo-benefício. Porém, o Opus tem vantagem clara para design de arquitetura em larga escala e tarefas de raciocínio complexo.
Assinatura ou API paga por uso: o que sai mais barato?
Para uso regular, as assinaturas são drasticamente mais baratas — cerca de 15 a 30 vezes mais econômicas que os preços da API. Até o plano Pro (US$20/mês) custaria mais de US$180 por mês com uso equivalente pela API. A API só compensa para uso muito esporádico ou cenários específicos de processamento em lote. Para uma comparação com os preços do ChatGPT, veja Claude vs ChatGPT - Comparação de Preços.
Quão "inteligente" é o Haiku 4.5?
A Anthropic o descreve como tendo "inteligência próxima à fronteira". Embora os benchmarks oficiais sejam limitados, espera-se que se aproxime da precisão do Sonnet para tarefas simples como classificação de conteúdo, sumarização e perguntas e respostas. Para raciocínio complexo ou geração de código longo, a diferença para o Sonnet/Opus fica evidente. Com 1/5 do custo, ele se destaca quando a prioridade é "qualidade suficiente em grande escala".
O Opus 4.6 é mais barato que os modelos Opus anteriores?
Sim, significativamente. O Opus 4.1 cobrava US$75/MTok pela saída, enquanto o Opus 4.6 cobra US$25/MTok — uma redução de 3x com desempenho aprimorado. A janela de contexto também foi ampliada de 200K para 1 milhão de tokens (aumento de 5x), tornando a proposta de valor substancialmente melhor.