Uma das primeiras perguntas ao usar o Claude é: "Devo usar o Opus, o Sonnet ou o Haiku?"

Os três modelos diferem em até 5x no preço da API, com diferenças claras de desempenho. Mas o modelo mais caro nem sempre é a melhor escolha. O Haiku pode ser mais prático para certas tarefas, enquanto outras realmente exigem o Opus.

Este artigo compara os preços, desempenho e velocidade mais recentes (abril de 2026), com estimativas de custo por tarefa para ajudar na sua decisão.

1. Os Três Modelos em Resumo

Os três modelos do Claude: Opus (máximo desempenho), Sonnet (equilibrado), Haiku (rápido e acessível)
ModeloPosicionamentoLançamentoResumo
Opus 4.6Modelo principalFev 2026O mais inteligente. Para agentes e programação complexa
Sonnet 4.6EquilibradoFev 2026Melhor equilíbrio entre velocidade e inteligência. Ideal para uso diário
Haiku 4.5Rápido e AcessívelOut 2025O mais rápido. Para tarefas em grande volume e em tempo real

Os nomes refletem o tamanho das formas literárias. Um opus (uma grande obra) representa o pensamento mais profundo, um soneto (poema de 14 versos) oferece profundidade equilibrada, e um haiku (poema de 3 versos) entrega respostas rápidas e concisas.

2. Comparação de Preços da API

Comparação de preços da API do Claude Opus, Sonnet e Haiku: entrada, saída, lote e cache

Preços Padrão (por Milhão de Tokens)

ModeloEntradaSaídaLote EntradaLote SaídaCache Hit
Opus 4.6US$5US$25US$2,50US$12,50US$0,50
Sonnet 4.6US$3US$15US$1,50US$7,50US$0,30
Haiku 4.5US$1US$5US$0,50US$2,50US$0,10

A diferença entre o mais caro (saída do Opus a US$25/MTok) e o mais barato (saída do Haiku a US$5/MTok) é de 5x. Porém, o Opus 4.6 é na verdade 3x mais barato que seu antecessor (o Opus 4.1 custava US$75/MTok).

Dicas para Reduzir Custos

A API de Lote reduz os custos pela metade, e os cache hits diminuem o custo de entrada para 1/10. Combinando ambos, é possível alcançar até 95% de economia. Se você faz processamento em grande volume, explore essas opções primeiro.

O Que É um "Token"?

O preço da API é baseado em "tokens". Em inglês, aproximadamente 1 palavra ≈ 1,3 tokens. Um milhão de tokens equivale a cerca de 750.000 palavras — aproximadamente 10 romances de tamanho médio.

3. Planos de Assinatura

As assinaturas mensais oferecem uma estrutura de preços fundamentalmente diferente do modelo pago por uso da API.

PlanoPreçoModelos DisponíveisPadrão
GratuitoUS$0Apenas Sonnet 4.5Sonnet 4.5
ProUS$20/mêsTodos os modelosSonnet 4.6
Max 5xUS$100/mêsTodos os modelosOpus 4.6
Max 20xUS$200/mêsTodos os modelosOpus 4.6

As assinaturas não são "ilimitadas", mas possuem limites de uso. Ainda assim, são 15 a 30 vezes mais baratas que os preços da API. Um usuário relatou ter consumido 10 bilhões de tokens em 8 meses — pelas tarifas da API, isso custaria mais de US$15.000, mas sua assinatura Max custou cerca de US$800.

Trocando de Modelo no Claude Code

No Claude Code, você pode trocar de modelo ao iniciar com claude --model opus ou claude --model sonnet, ou durante a sessão com /model sonnet. O plano Pro usa Sonnet por padrão, e o Max usa Opus. Para mais detalhes sobre o Claude Code, veja Claude Chat vs. Cowork vs. Code.

4. Benchmarks de Desempenho

BenchmarkO Que MedeOpus 4.6Sonnet 4.6Diferença
SWE-bench VerifiedCapacidade de programação80,8%79,6%Apenas 1,2pts
GPQA DiamondRaciocínio científico91,3%74,1%17,2pts
OSWorld-VerifiedAutomação de GUI72,7%72,5%Praticamente igual
MathProblemas matemáticos89%

O dado mais relevante: a diferença de desempenho em programação é de apenas 1,2 pontos. O Sonnet 4.6 é o primeiro Sonnet na história do Claude a igualar o Opus da geração anterior em benchmarks de código.

No entanto, o raciocínio científico (GPQA Diamond) apresenta uma diferença de 17,2 pontos, tornando o Opus claramente superior para análises acadêmicas e raciocínio lógico complexo.

Os benchmarks oficiais do Haiku 4.5 são limitados, mas a Anthropic o posiciona como tendo "inteligência próxima à fronteira". Para tarefas simples, espera-se que se aproxime da precisão do Sonnet.

5. Velocidade e Janelas de Contexto

ModeloVelocidade (aprox.)Janela de ContextoSaída Máxima
Opus 4.6~20–30 tok/seg1M tokens128K tokens
Sonnet 4.6~40–60 tok/seg1M tokens64K tokens
Haiku 4.52–5x mais rápido que o Sonnet200K tokens64K tokens

O grande trunfo do Haiku é a velocidade. Ele possui o menor tempo até o primeiro token (TTFT), sendo ideal para chatbots em tempo real e recursos de autocomplete.

O Opus oferece uma janela de contexto de 1 milhão de tokens (aproximadamente 10 a 20 romances) para tarefas como processar bases de código inteiras de uma só vez. Sua saída máxima de 128K tokens é o dobro do Sonnet/Haiku, ideal para gerar documentos longos em uma única chamada.

6. Estimativas de Custo por Caso de Uso

Veja quanto custam tarefas típicas com preços padrão da API (sem cache ou lote).

Cenário 1: Gerar um artigo de 2.000 palavras

Entrada: ~1.000 tokens, Saída: ~2.700 tokens

ModeloCusto EntradaCusto SaídaTotal
Opus 4.6US$0,005US$0,068~US$0,07
Sonnet 4.6US$0,003US$0,041~US$0,04
Haiku 4.5US$0,001US$0,014~US$0,02

Cenário 2: Ler um arquivo de código e refatorar

Entrada: ~10.000 tokens (código + instruções), Saída: ~5.000 tokens

ModeloCusto EntradaCusto SaídaTotal
Opus 4.6US$0,05US$0,125~US$0,18
Sonnet 4.6US$0,03US$0,075~US$0,11
Haiku 4.5US$0,01US$0,025~US$0,04

Cenário 3: Chatbot atendendo 1.000 consultas/dia

200 tokens de entrada + 300 tokens de saída por consulta × 1.000

ModeloCusto DiárioMensal (30 dias)
Opus 4.6US$8,50US$255
Sonnet 4.6US$5,10US$153
Haiku 4.5US$1,70US$51

Para cenários de alto volume como chatbots, a diferença mensal entre Haiku e Opus ultrapassa US$200. Uma abordagem prática é usar o Haiku como padrão e direcionar apenas consultas complexas para o Sonnet ou Opus.

7. Qual Modelo Escolher?

Fluxograma de seleção de modelo: escolhendo Opus, Sonnet ou Haiku conforme a complexidade e volume da tarefa
Caso de UsoRecomendadoPor quê
Programação e escrita diáriaSonnet 4.698% da qualidade do Opus em código, 40% mais barato, 2x mais rápido
Refatoração em larga escalaOpus 4.6Janela de 1M de contexto e 128K de saída fazem diferença
Análise acadêmicaOpus 4.617 pontos de diferença no GPQA. Raciocínio profundo não tem substituto
Chatbots e suporteHaiku 4.5O mais rápido + mais barato. Perfeito para respostas padrão
Processamento em loteHaiku 4.51/5 do custo, lida com volume eficientemente
Desenvolvimento com Claude CodeSonnet 4.6O plano Pro é suficiente. Use Opus apenas para arquitetura complexa

Conselho Prático

Na dúvida, comece com o Sonnet. Ele dá conta da maioria das tarefas. Só passe para o Opus quando a qualidade do Sonnet não for suficiente, e use o Haiku para tarefas simples e repetitivas. Essa abordagem em camadas oferece o melhor custo-benefício.

FAQ

Qual a diferença de desempenho em programação entre Opus e Sonnet?

No SWE-bench Verified (benchmark de programação), o Opus 4.6 marca 80,8% e o Sonnet 4.6 marca 79,6% — uma diferença de apenas 1,2 pontos. No dia a dia da programação, a diferença é quase imperceptível. Considerando a diferença de custo (US$25 vs US$15/MTok para saída), o Sonnet oferece melhor custo-benefício. Porém, o Opus tem vantagem clara para design de arquitetura em larga escala e tarefas de raciocínio complexo.

Assinatura ou API paga por uso: o que sai mais barato?

Para uso regular, as assinaturas são drasticamente mais baratas — cerca de 15 a 30 vezes mais econômicas que os preços da API. Até o plano Pro (US$20/mês) custaria mais de US$180 por mês com uso equivalente pela API. A API só compensa para uso muito esporádico ou cenários específicos de processamento em lote. Para uma comparação com os preços do ChatGPT, veja Claude vs ChatGPT - Comparação de Preços.

Quão "inteligente" é o Haiku 4.5?

A Anthropic o descreve como tendo "inteligência próxima à fronteira". Embora os benchmarks oficiais sejam limitados, espera-se que se aproxime da precisão do Sonnet para tarefas simples como classificação de conteúdo, sumarização e perguntas e respostas. Para raciocínio complexo ou geração de código longo, a diferença para o Sonnet/Opus fica evidente. Com 1/5 do custo, ele se destaca quando a prioridade é "qualidade suficiente em grande escala".

O Opus 4.6 é mais barato que os modelos Opus anteriores?

Sim, significativamente. O Opus 4.1 cobrava US$75/MTok pela saída, enquanto o Opus 4.6 cobra US$25/MTok — uma redução de 3x com desempenho aprimorado. A janela de contexto também foi ampliada de 200K para 1 milhão de tokens (aumento de 5x), tornando a proposta de valor substancialmente melhor.