Indice
- 1. Visao geral do lancamento — data, disponibilidade e ficha tecnica
- 2. O que ha de novo — 5 melhorias principais
- 3. Benchmarks — comparativo direto com Claude e Gemini
- 4. GPT-5.5 vs GPT-5.5 Pro — qual usar
- 5. Precos — por que o aumento de 2x
- 6. Disponibilidade nos planos do ChatGPT
- 7. Especificacoes da API e recursos para devs
- 8. Integracao com Codex e a estrategia Super-app
- 9. GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro
- 10. Pontos de atencao — cuidado com o excesso de confianca
- 11. Quando escolher GPT-5.5 — por caso de uso
- FAQ
Em 23 de abril de 2026, a OpenAI lancou o "ChatGPT 5.5 (GPT-5.5)." Apresentado pela propria OpenAI como "uma nova classe de inteligencia para trabalho real e agentes de IA," o modelo marcou 82.7% no Terminal-Bench 2.0, deixando para tras o Claude Opus 4.7 da Anthropic (69.4%) e o Gemini 3.1 Pro do Google (68.5%) e retomando o SOTA (state of the art) em 14 benchmarks no processo.
Ao mesmo tempo, o preco de tabela da API dobrou em relacao ao GPT-5.4 ($5/$30 por MTok), e o Claude Opus 4.7 continua superior no SWE-Bench Pro. A leitura honesta e "o mais forte, mas nao o melhor universal." Tambem ha uma tendencia documentada de responder com confianca sobre coisas que ele nao sabe de fato — algo a se ter em mente em trabalho medico, juridico ou regulado.
Com base no anuncio oficial da OpenAI, na OpenAI Developer Docs e em varios relatorios independentes de benchmark, este artigo entrega o panorama completo: o que ha de novo, os benchmarks, precos, disponibilidade nos planos, como se compara com Claude e Gemini e como escolher o modelo certo para o que voce esta fazendo.
1. Visao geral do lancamento — data, disponibilidade e ficha tecnica
| Item | Detalhes |
|---|---|
| Nome oficial | GPT-5.5 (exibido como "ChatGPT 5.5" no ChatGPT) |
| Data de lancamento | 23 de abril de 2026 |
| Desenvolvido por | OpenAI |
| Variantes | GPT-5.5 (padrao) / GPT-5.5 Pro (raciocinio profundo) |
| Janela de contexto | API: 1.050.000 tokens (~1M) / Codex: 400K tokens |
| Saida maxima | 128.000 tokens |
| Corte de conhecimento | 1 de dezembro de 2025 |
| Preco da API (padrao) | $5 / 1M tokens (entrada) / $0.50 (entrada em cache) / $30 (saida) |
| Preco da API (Pro) | $30 (entrada) / $180 (saida) |
| Sobretaxa de prompt longo | Acima de 272K tokens: entrada 2x, saida 1.5x |
| Modalidades | Texto entrada/saida, imagem na entrada (sem audio nem video) |
| Planos do ChatGPT | Plus / Pro / Business / Enterprise (nao esta no Free) |
| Recursos principais | Function calling, saidas estruturadas, streaming, controle de esforco de raciocinio, Computer Use, suporte a MCP |
2. O que ha de novo — 5 melhorias principais
1. Re-treinamento completo do modelo base (o primeiro desde o GPT-4.5)
O GPT-5.5 e o primeiro re-treinamento completo do modelo base desde o GPT-4.5. GPT-5, 5.1, 5.2 e 5.4 eram todos variantes ajustadas (fine-tuned) do mesmo modelo base, mas o GPT-5.5 foi reconstruido do zero. O resultado sao melhorias na eficiencia de raciocinio e atualizacao de conhecimento ao mesmo tempo.
2. Grandes ganhos de eficiencia em tokens (~40% de reducao)
O GPT-5.5 mantem a mesma latencia por token do GPT-5.4 enquanto reduz os tokens de saida necessarios para concluir tarefas no Codex em cerca de 40%. O preco de tabela dobrou, mas como o volume de saida cai 40%, a OpenAI afirma que o custo total para o mesmo trabalho geralmente cresce menos do que se imagina.
Greg Brockman, cofundador da OpenAI:
"E um modelo que pensa mais rapido e mais afiado com menos tokens — esse tipo de modelo, comparado a algo como o 5.4."
3. Janela de contexto ~1M (API)
A versao da API expande para 1.050.000 tokens (~1M). A integracao com o Codex e de 400K. ~1M tokens equivalem a aproximadamente 1.400 paginas A4 de texto. So nao esqueca da sobretaxa medida: prompts acima de 272K tokens incorrem em preco 2x na entrada e 1.5x na saida, entao cargas de trabalho com contexto muito longo precisam de modelagem de custo.
4. Controle de esforco de raciocinio em cinco niveis
A API expoe reasoning.effort com cinco configuracoes:
- none: sem raciocinio (mais rapido, mais barato)
- low: raciocinio leve
- medium: padrao (equilibrado)
- high: raciocinio profundo (tarefas complexas)
- xhigh: raciocinio maximo (mais lento e mais caro, maior precisao)
Isso espelha o controle output_config.effort do Claude Opus 4.7, e a industria como um todo esta convergindo para "deixe o chamador ajustar a profundidade de raciocinio."
5. Expert-SWE em 73.1% — lida com tarefas da classe de 20 horas
Na nova avaliacao interna publicada pela OpenAI Expert-SWE (tarefas de coding extremamente complexas com tempo mediano de 20 horas para um humano concluir), o GPT-5.5 alcancou 73.1% — um salto de 5.6 pontos sobre os 68.5% do GPT-5.4. E um avanco grande para a confiabilidade de agentes autonomos de coding em execucao prolongada.
3. Benchmarks — comparativo direto com Claude e Gemini
| Benchmark | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro | Vencedor |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 69.4% | 68.5% | 🥇 GPT-5.5 |
| GDPval (trabalho de conhecimento em 44 ocupacoes) | 84.9% | — | — | 🥇 GPT-5.5 |
| OSWorld-Verified (automacao de PC) | 78.7% | 78.0% | — | 🥇 GPT-5.5 (por pouco) |
| BrowseComp | 84.4% (Pro: 90.1%) | — | — | 🥇 GPT-5.5 Pro |
| FrontierMath Tier 4 | 35.4% (Pro: 39.6%) | 22.9% | 16.7% | 🥇 GPT-5.5 |
| SWE-Bench Pro | 58.6% | 64.3% | — | 🥇 Claude Opus 4.7 |
| Tau2-bench Telecom (atendimento ao cliente) | 98.0% | — | — | 🥇 GPT-5.5 |
| GPQA Diamond | 93.6% | — | — | 🥇 GPT-5.5 |
| Expert-SWE (interno da OpenAI) | 73.1% | — | — | 🥇 GPT-5.5 |
Conclusao: GPT-5.5 detem SOTA em 14 benchmarks, Claude em 4 e Gemini em 2
No conjunto de benchmarks publicado pela OpenAI, o GPT-5.5 detem SOTA em 14 benchmarks, o Claude Opus 4.7 em 4 e o Gemini 3.1 Pro em 2. A vantagem geral pertence claramente ao GPT-5.5.
Dito isso, no SWE-Bench Pro (tarefas de coding em nivel de producao), o Claude Opus 4.7 ainda ganha com 64.3% contra os 58.6% do GPT-5.5. Para trabalho de coding, dividir os modelos por tarefa ainda vale a pena.
Verificacao por terceiros: avaliacao de code review da CodeRabbit
O servico independente de code review CodeRabbit reporta as seguintes melhorias do GPT-5.5:
- Benchmark curado: deteccao esperada de problemas 58.3% → 79.2%, precisao 27.9% → 40.6%
- Conjunto de dados do mundo real: deteccao de problemas 55.0% → 65.0%, precisao 11.6% → 13.2%
A leitura da CodeRabbit: "o modelo prefere mudancas locais, preserva o comportamento e tende a focar nos pontos reais de falha." Em outras palavras — em vez de reescritas amplas, ele se inclina a correcoes precisas e direcionadas.
4. GPT-5.5 vs GPT-5.5 Pro — qual usar
| Item | GPT-5.5 (padrao) | GPT-5.5 Pro |
|---|---|---|
| Preco da API (entrada) | $5 / 1M tokens | $30 / 1M tokens (6x) |
| Preco da API (saida) | $30 / 1M tokens | $180 / 1M tokens (6x) |
| BrowseComp | 84.4% | 90.1% |
| FrontierMath Tier 4 | 35.4% | 39.6% |
| Planos do ChatGPT | Plus / Pro / Business / Enterprise | Apenas Pro / Business / Enterprise |
| Indicado para | Tarefas do dia a dia, coding, agentes | Pesquisa cientifica, matematica complexa, raciocinio profundo |
Como escolher
- Escolha o GPT-5.5 padrao: coding em geral, escrita, cargas de agentes, uso com foco em custo
- Escolha o GPT-5.5 Pro: matematica e pesquisa cientifica, redacao de papers, decisao complexa — precisao acima de custo
5. Precos — por que o aumento de 2x
Preco da API (GPT-5.5 padrao)
| Item | Preco | Notas |
|---|---|---|
| Entrada | $5.00 / 1M tokens | 2x o GPT-5.4 |
| Entrada em cache | $0.50 / 1M tokens | 1/10 da entrada normal |
| Saida | $30.00 / 1M tokens | 2x o GPT-5.4 |
| Prompts longos (>272K tokens) | Entrada 2x, saida 1.5x | Aplicado a sessao inteira |
| Batch API / Flex | 50% de desconto | Para cargas assincronas |
| Processamento Priority | 2.5x | Para requisitos de baixa latencia |
| Processamento regional (residencia de dados) | +10% | Para casos de compliance |
Por que o aumento de 2x?
A OpenAI nao explicou diretamente o aumento de preco, mas os fatores provaveis sao:
- Custo de um re-treinamento completo do modelo base — a primeira reconstrucao do zero desde o GPT-4.5
- Precificacao dos ganhos de desempenho — melhorias significativas em Terminal-Bench e outros
- A eficiencia em tokens compensa parte da dor — 40% menos tokens de saida equilibra parcialmente o preco unitario maior
Para cargas com saida intensa, o aumento de custo efetivo fica em torno de "2x x 0.6 = 1.2x." Mas para tarefas com entrada intensa (resumo, analise), voce leva o aumento total de 2x na cabeca — tenha isso em mente.
6. Disponibilidade nos planos do ChatGPT
| Plano | Mensal | GPT-5.5 | GPT-5.5 Pro | Codex |
|---|---|---|---|---|
| Free | $0 | ❌ Nao | ❌ Nao | ❌ Nao |
| Plus | $20/mes | ✅ Sim | ❌ Nao | ✅ Sim |
| Pro | $200/mes | ✅ Sim | ✅ Sim | ✅ Sim (inclui Fast Mode) |
| Business | Por uso | ✅ Sim | ✅ Sim | ✅ Sim |
| Enterprise | Sob consulta | ✅ Sim | ✅ Sim | ✅ Sim |
Usuarios Free continuam no GPT-5 (ou 5.4)
O GPT-5.5 nao esta disponivel no plano Free — usuarios Free continuam no GPT-5 (ou 5.4). O Plus ($20/mes) e o ponto de entrada.
7. Especificacoes da API e recursos para devs
Recursos suportados
- ✅ Function calling
- ✅ Saidas estruturadas (JSON Schema)
- ✅ Streaming
- ✅ Controle de esforco de raciocinio (none/low/medium/high/xhigh)
- ✅ Ferramentas: web search, file search, geracao de imagem, Code Interpreter, Hosted Shell, Apply Patch, Skills, Computer Use, MCP, Tool Search
- ✅ Distillation (para modelos menores)
- ❌ Fine-tuning: nao suportado no lancamento
- ❌ Audio / video na entrada ou saida: nao suportado
Limites de taxa (Tier 5: o mais alto)
- RPM (requisicoes por minuto): 15.000
- TPM (tokens por minuto): 40.000.000
- Limite da fila Batch: 15.000.000.000
Exemplo de esforco de raciocinio (Python)
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.5",
reasoning={"effort": "high"}, # none/low/medium/high/xhigh
input="Resolva este problema matematico complexo passo a passo..."
)
print(response.output_text)
8. Integracao com Codex e a estrategia Super-app
Codex Fast Mode
Junto com o lancamento do GPT-5.5, o Codex ganhou um Fast Mode:
- Processamento 1.5x mais rapido
- 2.5x do custo (em creditos)
- Disponivel nos planos Pro / Business / Enterprise
A estrategia Super-app
A OpenAI tambem revelou uma visao de "Super-app" que une "ChatGPT + Codex + navegador de IA" em uma unica oferta. O plano e entregar isso como um pacote enterprise unico — o que a OpenAI chama de "um passo em direcao a uma computacao mais agentica e mais intuitiva."
Conceitualmente, e o padrao "pacote tudo-em-um para maximizar a experiencia do desenvolvedor" de PaaS como a Vercel ou Next.js, trazido para o espaco de agentes de IA.
9. GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro
| Item | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Lancado | 23 de abril de 2026 | 16 de abril de 2026 | Inicio de 2026 |
| Entrada da API | $5/MTok | $5/MTok | Nao divulgado |
| Saida da API | $30/MTok | $25/MTok | Nao divulgado |
| Contexto | 1.050K | 1.000K (200K padrao) | 1.000K |
| Corte de conhecimento | 1 dez 2025 | ~inicio de 2025 | ~inicio de 2025 |
| Benchmarks SOTA | 14 | 4 | 2 |
| Terminal-Bench 2.0 | 82.7% | 69.4% | 68.5% |
| SWE-Bench Pro | 58.6% | 64.3% | — |
| FrontierMath T4 | 35.4% | 22.9% | 16.7% |
| Pontos fortes | Agentes, tarefas longas, operacao de PC | Sessoes longas de coding, seguranca, escrita longa | Multimodal, integracao com Google Workspace |
Como escolher
- Melhor no geral + desempenho de agente de ponta — GPT-5.5 (especialmente se >$30/MTok de saida for aceitavel)
- Coding autonomo longo e trabalho com seguranca em primeiro lugar — Claude Opus 4.7 (vence no SWE-Bench Pro e tem preco de saida mais barato)
- Integracao com Google Workspace e multimodal — Gemini 3.1 Pro
10. Pontos de atencao — cuidado com o excesso de confianca
Analise independente (Handy AI) sinaliza uma tendencia no GPT-5.5 de "responder com confianca sobre coisas que ele nao sabe de fato."
"O modelo sabe mais, mas tambem responde com mais confianca sobre coisas que nao sabe."
Casos de uso de alto risco
- ⚠️ Diagnostico medico ou prescricoes — informacao errada pode ser fatal
- ⚠️ Aconselhamento juridico ou pesquisa de jurisprudencia — citar casos alucinados e questao de etica profissional
- ⚠️ Aconselhamento financeiro ou trabalho fiscal — exposicao regulatoria
- ⚠️ Citacoes em escrita academica — casos conhecidos de citar papers inexistentes
Mitigacoes
- Fact-checking obrigatorio — nunca use a saida da IA como esta; verifique contra fontes primarias
- Use a ferramenta de web search — faca o modelo buscar informacoes em tempo real
- Verifique cruzando com Claude Opus 4.7 — para trabalho critico em precisao, passe as respostas por varios modelos
- Diga para ele responder "nao sei" — instrua via system prompt: "se incerto, diga isso explicitamente"
11. Quando escolher GPT-5.5 — por caso de uso
✅ Escolha o GPT-5.5 quando
- Agentes autonomos de coding em execucao prolongada — Expert-SWE 73.1% e o melhor da classe
- Automacao de PC / Computer Use — OSWorld 78.7% esta a par do Opus 4.7
- Automacao de atendimento ao cliente — Tau2-bench 98.0% e essencialmente perfeito
- Matematica avancada e pesquisa cientifica — FrontierMath T4 35.4% (bem acima dos 22.9% do Opus 4.7)
- Voce esta comprometido com o ecossistema OpenAI — integra com ChatGPT, Codex, Operator
❌ Pule o GPT-5.5 quando
- Coding de producao em nivel SWE-Bench Pro — Claude Opus 4.7 ainda lidera
- Trabalho critico em precisao (medico, juridico, financeiro) — cuidado com alucinacoes
- Custo e a prioridade maxima — $30/MTok de saida esta no topo da faixa
- Voce quer uma opcao gratuita — nao esta disponivel no plano Free
- Processamento de audio ou video — apenas entrada de texto + imagem
FAQ
Q1. Quando o GPT-5.5 ficou disponivel no ChatGPT?
23 de abril de 2026 (horario dos EUA), nos planos Plus, Pro, Business e Enterprise. O GPT-5.5 Pro esta restrito a Pro, Business e Enterprise.
Q2. Posso usar o GPT-5.5 no plano Free?
Nao. O plano Free continua no GPT-5 (ou 5.4). Para acessar o GPT-5.5 voce precisa de pelo menos o plano Plus de $20/mes.
Q3. GPT-5.5 vs Claude Opus 4.7 — qual e melhor?
No geral, o GPT-5.5 (SOTA em 14 benchmarks contra os 4 do Claude). Mas no SWE-Bench Pro, o Claude Opus 4.7 vence por 64.3% a 58.6% — entao para coding de producao, o Claude leva vantagem. O Claude tambem e mais barato na saida ($25/MTok vs $30/MTok do GPT-5.5).
Q4. A API ficou mais cara — como manter os custos sob controle?
Sim, $5/$30 por MTok e 2x o GPT-5.4. Mas o uso de tokens de saida cai cerca de 40%, entao para cargas com saida intensa o aumento real de custo costuma ficar em torno de 1.2x. Dicas de controle de custo:
1. Use Batch API / Flex (50% de desconto)
2. Use entrada em cache ($0.50/MTok, 1/10 do normal)
3. Use reasoning.effort=low para tarefas mais leves
4. Evite prompts acima de 272K tokens
Q5. O que muda de fato no GPT-5.5 Pro?
Tem raciocinio mais forte, com saltos notaveis em matematica complexa (FrontierMath: 35.4% → 39.6%) e tarefas de pesquisa cientifica. O porem e o preco — 6x a tarifa da API ($30 entrada / $180 saida). Fora de pesquisa e escrita seria de papers, o custo-beneficio frequentemente nao fecha.
Q6. Fine-tuning e suportado?
Nao, em abril de 2026. Distillation (treinar modelos menores a partir das saidas) e suportado, entao voce pode usar saidas do GPT-5.5 para treinar algo como o GPT-5 nano.
Q7. Algo a se observar ao usar o contexto de 1M?
Prompts acima de 272K tokens disparam uma sobretaxa de 2x na entrada e 1.5x na saida em toda a sessao. Se voce esta projetando uma API em torno do uso de 1M tokens, calcule os custos antes.
Q8. Qual e o corte de conhecimento do GPT-5.5?
1 de dezembro de 2025. Qualquer coisa depois disso (a partir de janeiro de 2026) nao esta nos dados de treinamento, entao a ferramenta de web search e praticamente obrigatoria para informacoes atuais.
Q9. As alucinacoes melhoraram?
Analises independentes dizem que "a base de conhecimento cresceu, mas a confianca do modelo sobre coisas que ele nao sabe tambem cresceu." A OpenAI alega melhorias de seguranca oficialmente, mas para trabalho medico, juridico ou financeiro, fact-checking continua obrigatorio.
Q10. Meu app GPT-5 existente vai funcionar do mesmo jeito?
A compatibilidade da API e preservada — trocar o ID do modelo de gpt-5 para gpt-5.5 ja basta para migrar. Dito isso, aproveitar os novos recursos (como o parametro reasoning.effort, ou especificar o ID da variante Pro) merece uma revisao de design.
Encerrando: o GPT-5.5 e o mais forte, mas nao o melhor universal
O GPT-5.5 detem SOTA em 14 benchmarks e abre vantagem clara sobre Claude Opus 4.7 e Gemini 3.1 Pro para retomar o topo da industria. E especialmente forte em tarefas de agente, automacao de PC, coding autonomo de longa duracao e matematica e pesquisa cientifica.
Ao mesmo tempo, ainda perde para o Claude Opus 4.7 no SWE-Bench Pro, mostra uma tendencia de "alucinacao confiante" e vem com uma alta de 2x no preco da API — entao nao e uma vitoria incondicional.
A jogada mais inteligente e "escolher o certo — GPT-5.5, Claude Opus 4.7 ou Gemini 3.1 Pro — para a tarefa em maos." Tudo no ecossistema OpenAI? GPT-5.5. Sessoes longas de coding e trabalho com seguranca em primeiro lugar? Claude. Integracao com Google Workspace? Gemini. Operacoes multi-modelo estao se tornando o padrao de 2026.
Artigos relacionados
- Analise completa do lancamento do Claude Opus 4.7 — todos os detalhes do concorrente direto
- Guia de migracao para o Claude Opus 4.7 — saindo do 4.6 para o 4.7
- Comparativo de precos Claude vs ChatGPT — como as estruturas de plano se comparam
- O que e o Next.js? — o framework React que a IA fica recomendando