Claude Opus vs Sonnet vs Haiku - Comparação de Preços

Claude Opus vs. Sonnet vs. Haiku: Guia Completo de Preços e Desempenho

Índice

1. Os Três Modelos em Resumo
2. Comparação de Preços da API
3. Planos de Assinatura
4. Benchmarks de Desempenho
5. Velocidade e Janelas de Contexto
6. Estimativas de Custo por Caso de Uso
7. Qual Modelo Escolher?
FAQ

Uma das primeiras perguntas ao usar o Claude é: "Devo usar o Opus, o Sonnet ou o Haiku?"

Os três modelos diferem em até 5x no preço da API, com diferenças claras de desempenho. Mas o modelo mais caro nem sempre é a melhor escolha. O Haiku pode ser mais prático para certas tarefas, enquanto outras realmente exigem o Opus.

Este artigo compara os preços, desempenho e velocidade mais recentes (abril de 2026), com estimativas de custo por tarefa para ajudar na sua decisão.

1. Os Três Modelos em Resumo

Os três modelos do Claude: Opus (máximo desempenho), Sonnet (equilibrado), Haiku (rápido e acessível)

Modelo	Posicionamento	Lançamento	Resumo
Opus 4.6	Modelo principal	Fev 2026	O mais inteligente. Para agentes e programação complexa
Sonnet 4.6	Equilibrado	Fev 2026	Melhor equilíbrio entre velocidade e inteligência. Ideal para uso diário
Haiku 4.5	Rápido e Acessível	Out 2025	O mais rápido. Para tarefas em grande volume e em tempo real

Os nomes refletem o tamanho das formas literárias. Um opus (uma grande obra) representa o pensamento mais profundo, um soneto (poema de 14 versos) oferece profundidade equilibrada, e um haiku (poema de 3 versos) entrega respostas rápidas e concisas.

2. Comparação de Preços da API

Comparação de preços da API do Claude Opus, Sonnet e Haiku: entrada, saída, lote e cache

Preços Padrão (por Milhão de Tokens)

Modelo	Entrada	Saída	Lote Entrada	Lote Saída	Cache Hit
Opus 4.6	US$5	US$25	US$2,50	US$12,50	US$0,50
Sonnet 4.6	US$3	US$15	US$1,50	US$7,50	US$0,30
Haiku 4.5	US$1	US$5	US$0,50	US$2,50	US$0,10

A diferença entre o mais caro (saída do Opus a US$25/MTok) e o mais barato (saída do Haiku a US$5/MTok) é de 5x. Porém, o Opus 4.6 é na verdade 3x mais barato que seu antecessor (o Opus 4.1 custava US$75/MTok).

Dicas para Reduzir Custos

A API de Lote reduz os custos pela metade, e os cache hits diminuem o custo de entrada para 1/10. Combinando ambos, é possível alcançar até 95% de economia. Se você faz processamento em grande volume, explore essas opções primeiro.

O Que É um "Token"?

O preço da API é baseado em "tokens". Em inglês, aproximadamente 1 palavra ≈ 1,3 tokens. Um milhão de tokens equivale a cerca de 750.000 palavras — aproximadamente 10 romances de tamanho médio.

3. Planos de Assinatura

As assinaturas mensais oferecem uma estrutura de preços fundamentalmente diferente do modelo pago por uso da API.

Plano	Preço	Modelos Disponíveis	Padrão
Gratuito	US$0	Apenas Sonnet 4.5	Sonnet 4.5
Pro	US$20/mês	Todos os modelos	Sonnet 4.6
Max 5x	US$100/mês	Todos os modelos	Opus 4.6
Max 20x	US$200/mês	Todos os modelos	Opus 4.6

As assinaturas não são "ilimitadas", mas possuem limites de uso. Ainda assim, são 15 a 30 vezes mais baratas que os preços da API. Um usuário relatou ter consumido 10 bilhões de tokens em 8 meses — pelas tarifas da API, isso custaria mais de US$15.000, mas sua assinatura Max custou cerca de US$800.

Trocando de Modelo no Claude Code

No Claude Code, você pode trocar de modelo ao iniciar com claude --model opus ou claude --model sonnet, ou durante a sessão com /model sonnet. O plano Pro usa Sonnet por padrão, e o Max usa Opus. Para mais detalhes sobre o Claude Code, veja Claude Chat vs. Cowork vs. Code.

4. Benchmarks de Desempenho

Benchmark	O Que Mede	Opus 4.6	Sonnet 4.6	Diferença
SWE-bench Verified	Capacidade de programação	80,8%	79,6%	Apenas 1,2pts
GPQA Diamond	Raciocínio científico	91,3%	74,1%	17,2pts
OSWorld-Verified	Automação de GUI	72,7%	72,5%	Praticamente igual
Math	Problemas matemáticos	—	89%	—

O dado mais relevante: a diferença de desempenho em programação é de apenas 1,2 pontos. O Sonnet 4.6 é o primeiro Sonnet na história do Claude a igualar o Opus da geração anterior em benchmarks de código.

No entanto, o raciocínio científico (GPQA Diamond) apresenta uma diferença de 17,2 pontos, tornando o Opus claramente superior para análises acadêmicas e raciocínio lógico complexo.

Os benchmarks oficiais do Haiku 4.5 são limitados, mas a Anthropic o posiciona como tendo "inteligência próxima à fronteira". Para tarefas simples, espera-se que se aproxime da precisão do Sonnet.

5. Velocidade e Janelas de Contexto

Modelo	Velocidade (aprox.)	Janela de Contexto	Saída Máxima
Opus 4.6	~20–30 tok/seg	1M tokens	128K tokens
Sonnet 4.6	~40–60 tok/seg	1M tokens	64K tokens
Haiku 4.5	2–5x mais rápido que o Sonnet	200K tokens	64K tokens

O grande trunfo do Haiku é a velocidade. Ele possui o menor tempo até o primeiro token (TTFT), sendo ideal para chatbots em tempo real e recursos de autocomplete.

O Opus oferece uma janela de contexto de 1 milhão de tokens (aproximadamente 10 a 20 romances) para tarefas como processar bases de código inteiras de uma só vez. Sua saída máxima de 128K tokens é o dobro do Sonnet/Haiku, ideal para gerar documentos longos em uma única chamada.

6. Estimativas de Custo por Caso de Uso

Veja quanto custam tarefas típicas com preços padrão da API (sem cache ou lote).

Cenário 1: Gerar um artigo de 2.000 palavras

Entrada: ~1.000 tokens, Saída: ~2.700 tokens

Modelo	Custo Entrada	Custo Saída	Total
Opus 4.6	US$0,005	US$0,068	~US$0,07
Sonnet 4.6	US$0,003	US$0,041	~US$0,04
Haiku 4.5	US$0,001	US$0,014	~US$0,02

Cenário 2: Ler um arquivo de código e refatorar

Entrada: ~10.000 tokens (código + instruções), Saída: ~5.000 tokens

Modelo	Custo Entrada	Custo Saída	Total
Opus 4.6	US$0,05	US$0,125	~US$0,18
Sonnet 4.6	US$0,03	US$0,075	~US$0,11
Haiku 4.5	US$0,01	US$0,025	~US$0,04

Cenário 3: Chatbot atendendo 1.000 consultas/dia

200 tokens de entrada + 300 tokens de saída por consulta × 1.000

Modelo	Custo Diário	Mensal (30 dias)
Opus 4.6	US$8,50	US$255
Sonnet 4.6	US$5,10	US$153
Haiku 4.5	US$1,70	US$51

Para cenários de alto volume como chatbots, a diferença mensal entre Haiku e Opus ultrapassa US$200. Uma abordagem prática é usar o Haiku como padrão e direcionar apenas consultas complexas para o Sonnet ou Opus.

7. Qual Modelo Escolher?

Fluxograma de seleção de modelo: escolhendo Opus, Sonnet ou Haiku conforme a complexidade e volume da tarefa

Caso de Uso	Recomendado	Por quê
Programação e escrita diária	Sonnet 4.6	98% da qualidade do Opus em código, 40% mais barato, 2x mais rápido
Refatoração em larga escala	Opus 4.6	Janela de 1M de contexto e 128K de saída fazem diferença
Análise acadêmica	Opus 4.6	17 pontos de diferença no GPQA. Raciocínio profundo não tem substituto
Chatbots e suporte	Haiku 4.5	O mais rápido + mais barato. Perfeito para respostas padrão
Processamento em lote	Haiku 4.5	1/5 do custo, lida com volume eficientemente
Desenvolvimento com Claude Code	Sonnet 4.6	O plano Pro é suficiente. Use Opus apenas para arquitetura complexa

Conselho Prático

Na dúvida, comece com o Sonnet. Ele dá conta da maioria das tarefas. Só passe para o Opus quando a qualidade do Sonnet não for suficiente, e use o Haiku para tarefas simples e repetitivas. Essa abordagem em camadas oferece o melhor custo-benefício.

FAQ

Qual a diferença de desempenho em programação entre Opus e Sonnet?

No SWE-bench Verified (benchmark de programação), o Opus 4.6 marca 80,8% e o Sonnet 4.6 marca 79,6% — uma diferença de apenas 1,2 pontos. No dia a dia da programação, a diferença é quase imperceptível. Considerando a diferença de custo (US$25 vs US$15/MTok para saída), o Sonnet oferece melhor custo-benefício. Porém, o Opus tem vantagem clara para design de arquitetura em larga escala e tarefas de raciocínio complexo.

Assinatura ou API paga por uso: o que sai mais barato?

Para uso regular, as assinaturas são drasticamente mais baratas — cerca de 15 a 30 vezes mais econômicas que os preços da API. Até o plano Pro (US$20/mês) custaria mais de US$180 por mês com uso equivalente pela API. A API só compensa para uso muito esporádico ou cenários específicos de processamento em lote. Para uma comparação com os preços do ChatGPT, veja Claude vs ChatGPT - Comparação de Preços.

Quão "inteligente" é o Haiku 4.5?

A Anthropic o descreve como tendo "inteligência próxima à fronteira". Embora os benchmarks oficiais sejam limitados, espera-se que se aproxime da precisão do Sonnet para tarefas simples como classificação de conteúdo, sumarização e perguntas e respostas. Para raciocínio complexo ou geração de código longo, a diferença para o Sonnet/Opus fica evidente. Com 1/5 do custo, ele se destaca quando a prioridade é "qualidade suficiente em grande escala".

O Opus 4.6 é mais barato que os modelos Opus anteriores?

Sim, significativamente. O Opus 4.1 cobrava US$75/MTok pela saída, enquanto o Opus 4.6 cobra US$25/MTok — uma redução de 3x com desempenho aprimorado. A janela de contexto também foi ampliada de 200K para 1 milhão de tokens (aumento de 5x), tornando a proposta de valor substancialmente melhor.

Claude Opus vs. Sonnet vs. Haiku: Guia Completo de Preços e Desempenho

1. Os Três Modelos em Resumo

2. Comparação de Preços da API

Preços Padrão (por Milhão de Tokens)

O Que É um "Token"?

3. Planos de Assinatura

4. Benchmarks de Desempenho

5. Velocidade e Janelas de Contexto

6. Estimativas de Custo por Caso de Uso

Cenário 1: Gerar um artigo de 2.000 palavras

Cenário 2: Ler um arquivo de código e refatorar

Cenário 3: Chatbot atendendo 1.000 consultas/dia

7. Qual Modelo Escolher?

FAQ

Artigos relacionados

Os 3 modos do Claude: Chat, Cowork e Code — Comparação completa e dicas de uso

Ranking das 15 profissões mais ameaçadas pela IA generativa — e como se proteger [2026]

O que é o Claude Agent SDK? Guia completo para criar agentes de IA

Datas de corte de conhecimento das principais IAs generativas [2026] ChatGPT, Claude, Gemini e mais

Comentários

Deixe um comentário

Claude Opus vs. Sonnet vs. Haiku: Guia Completo de Pre&ccedil;os e Desempenho

1. Os Três Modelos em Resumo

2. Comparação de Preços da API

Preços Padrão (por Milhão de Tokens)

O Que É um "Token"?

3. Planos de Assinatura

4. Benchmarks de Desempenho

5. Velocidade e Janelas de Contexto

6. Estimativas de Custo por Caso de Uso

Cenário 1: Gerar um artigo de 2.000 palavras

Cenário 2: Ler um arquivo de código e refatorar

Cenário 3: Chatbot atendendo 1.000 consultas/dia

7. Qual Modelo Escolher?

FAQ

Artigos relacionados

Os 3 modos do Claude: Chat, Cowork e Code — Comparação completa e dicas de uso

Ranking das 15 profissões mais ameaçadas pela IA generativa — e como se proteger [2026]

O que é o Claude Agent SDK? Guia completo para criar agentes de IA

Datas de corte de conhecimento das principais IAs generativas [2026] ChatGPT, Claude, Gemini e mais

Comentários

Deixe um comentário

Claude Opus vs. Sonnet vs. Haiku: Guia Completo de Preços e Desempenho