Содержание
- 1. Обзор релиза — дата, доступность, спецификации
- 2. Что нового — 5 ключевых улучшений
- 3. Бенчмарки — прямое сравнение с Claude и Gemini
- 4. GPT-5.5 vs GPT-5.5 Pro — что выбрать
- 5. Цены — почему рост в 2 раза
- 6. Доступность по планам ChatGPT
- 7. Спецификации API и возможности для разработчиков
- 8. Интеграция с Codex и стратегия Super-app
- 9. Подробное сравнение с Claude Opus 4.7 и Gemini 3.1 Pro
- 10. На что обратить внимание — склонность к «самоуверенности»
- 11. Когда выбирать GPT-5.5 — по сценариям
- FAQ
23 апреля 2026 года OpenAI выпустила «ChatGPT 5.5 (GPT-5.5)». Сама OpenAI называет её «новым классом интеллекта для real work (реальной работы) и AI-агентов»: модель набрала 82.7% на Terminal-Bench 2.0, заметно опередив Claude Opus 4.7 от Anthropic (69.4%) и Gemini 3.1 Pro от Google (68.5%), и вернула себе SOTA (state of the art) на 14 бенчмарках.
В то же время прайс API удвоился по сравнению с GPT-5.4 ($5/$30 за MTok), а на SWE-Bench Pro её по-прежнему обходит Claude Opus 4.7. Честная оценка — «самая сильная, но не универсально лучшая». Кроме того, отмечена склонность уверенно отвечать о том, чего модель на самом деле не знает — с этим стоит быть осторожным в медицине, праве и других регулируемых сферах.
На основе официального релиза OpenAI, OpenAI Developer Docs и нескольких независимых отчётов о бенчмарках в этой статье разбираем GPT-5.5 целиком: новые возможности, бенчмарки, цены, доступность по тарифам, сравнение с Claude и Gemini и как выбрать подходящую модель под задачу.
1. Обзор релиза — дата, доступность, спецификации
| Параметр | Значение |
|---|---|
| Официальное название | GPT-5.5 (в ChatGPT отображается как «ChatGPT 5.5») |
| Дата релиза | 23 апреля 2026 |
| Разработчик | OpenAI |
| Варианты | GPT-5.5 (стандартный) / GPT-5.5 Pro (глубокое рассуждение) |
| Контекстное окно | API: 1 050 000 токенов (~1M) / Codex: 400K токенов |
| Максимальный вывод | 128 000 токенов |
| Граница знаний | 1 декабря 2025 |
| Цены API (стандарт) | $5 / 1M токенов (вход) / $0.50 (кешированный вход) / $30 (выход) |
| Цены API (Pro) | $30 (вход) / $180 (выход) |
| Надбавка за длинные промпты | Свыше 272K токенов: вход x2, выход x1.5 |
| Модальности | Текст на вход/выход, изображения на вход (аудио и видео не поддерживаются) |
| Планы ChatGPT | Plus / Pro / Business / Enterprise (на Free недоступна) |
| Ключевые возможности | Function calling, структурированный вывод, стриминг, управление reasoning effort, Computer Use, поддержка MCP |
2. Что нового — 5 ключевых улучшений
1. Полное переобучение базовой модели (впервые с GPT-4.5)
GPT-5.5 — первое полное переобучение базовой модели со времён GPT-4.5. GPT-5, 5.1, 5.2 и 5.4 были файнтюн-вариантами одной и той же базы, а GPT-5.5 пересобрана с нуля. В результате одновременно улучшены и эффективность рассуждений, и актуальность знаний.
2. Серьёзный прирост эффективности по токенам (~40% меньше)
GPT-5.5 сохраняет ту же латентность на токен, что и GPT-5.4, но при этом сокращает количество выходных токенов, нужных для выполнения задач Codex, примерно на 40%. Прайс вырос в 2 раза, но из-за того, что объём вывода падает на 40%, OpenAI утверждает, что суммарная стоимость той же работы обычно растёт меньше, чем ожидалось.
Сооснователь OpenAI Грег Брокман:
«Это модель, которая думает быстрее и резче, используя меньше токенов — именно такая модель, в сравнении, например, с 5.4».
3. Контекстное окно ~1M (в API-версии)
API-версия расширена до 1 050 000 токенов (~1M). Codex-версия — 400K. ~1M токенов — это примерно 1 400 страниц текста A4. Только не забывайте про надбавку: промпты свыше 272K токенов оплачиваются с коэффициентом x2 на вход и x1.5 на выход — для очень длинных контекстов нужна модель затрат.
4. Управление reasoning effort на 5 уровнях
В API доступен параметр reasoning.effort с пятью значениями:
- none: без рассуждений (быстрее и дешевле всего)
- low: лёгкие рассуждения
- medium: значение по умолчанию (баланс)
- high: глубокие рассуждения (сложные задачи)
- xhigh: максимум рассуждений (медленнее и дороже всего, наивысшая точность)
Это аналог переключателя output_config.effort в Claude Opus 4.7: вся индустрия сходится к идее «вызывающая сторона сама регулирует глубину рассуждений».
5. Expert-SWE — 73.1%, задачи на 20 часов работы
На свежем внутреннем бенчмарке OpenAI Expert-SWE (крайне сложные задачи по программированию с медианным временем выполнения человеком 20 часов) GPT-5.5 показала 73.1% — рост на 5.6 пункта по сравнению с 68.5% у GPT-5.4. Это серьёзный шаг вперёд для надёжности долгих автономных кодинг-агентов.
3. Бенчмарки — прямое сравнение с Claude и Gemini
| Бенчмарк | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro | Победитель |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 69.4% | 68.5% | 🥇 GPT-5.5 |
| GDPval (44 профессии, knowledge work) | 84.9% | — | — | 🥇 GPT-5.5 |
| OSWorld-Verified (автоматизация ПК) | 78.7% | 78.0% | — | 🥇 GPT-5.5 (с минимальным отрывом) |
| BrowseComp | 84.4% (Pro: 90.1%) | — | — | 🥇 GPT-5.5 Pro |
| FrontierMath Tier 4 | 35.4% (Pro: 39.6%) | 22.9% | 16.7% | 🥇 GPT-5.5 |
| SWE-Bench Pro | 58.6% | 64.3% | — | 🥇 Claude Opus 4.7 |
| Tau2-bench Telecom (поддержка клиентов) | 98.0% | — | — | 🥇 GPT-5.5 |
| GPQA Diamond | 93.6% | — | — | 🥇 GPT-5.5 |
| Expert-SWE (внутренний бенчмарк OpenAI) | 73.1% | — | — | 🥇 GPT-5.5 |
Итог: GPT-5.5 удерживает SOTA на 14 бенчмарках, Claude — на 4, Gemini — на 2
По всему набору опубликованных OpenAI бенчмарков GPT-5.5 удерживает SOTA на 14 бенчмарках, Claude Opus 4.7 — на 4, Gemini 3.1 Pro — на 2. Преимущество в общем зачёте явно у GPT-5.5.
Тем не менее на SWE-Bench Pro (production-grade задачи по программированию) Claude Opus 4.7 по-прежнему впереди — 64.3% против 58.6% у GPT-5.5. Для кодинговых задач разделение моделей по сценариям всё ещё имеет смысл.
Независимая проверка: оценка код-ревью от CodeRabbit
Независимый сервис код-ревью CodeRabbit зафиксировал у GPT-5.5 следующие улучшения:
- Курируемый бенчмарк: ожидаемое обнаружение проблем 58.3% → 79.2%, точность 27.9% → 40.6%
- Реальный датасет: обнаружение проблем 55.0% → 65.0%, точность 11.6% → 13.2%
Вывод CodeRabbit: «модель предпочитает локальные изменения, сохраняет поведение и склонна фокусироваться на реальных точках сбоев». Иными словами — вместо масштабных переписываний она тяготеет к точечным и аккуратным правкам.
4. GPT-5.5 vs GPT-5.5 Pro — что выбрать
| Параметр | GPT-5.5 (стандарт) | GPT-5.5 Pro |
|---|---|---|
| Цена API (вход) | $5 / 1M токенов | $30 / 1M токенов (x6) |
| Цена API (выход) | $30 / 1M токенов | $180 / 1M токенов (x6) |
| BrowseComp | 84.4% | 90.1% |
| FrontierMath Tier 4 | 35.4% | 39.6% |
| Планы ChatGPT | Plus / Pro / Business / Enterprise | Только Pro / Business / Enterprise |
| Лучше всего подходит для | Повседневные задачи, кодинг, агенты | Научные исследования, сложная математика, глубокое рассуждение |
Как выбрать
- Стандартная GPT-5.5: общий кодинг, тексты, агенты, экономия бюджета
- GPT-5.5 Pro: математика и научные исследования, написание статей, сложные решения — точность важнее цены
5. Цены — почему рост в 2 раза
Цены API (стандартная GPT-5.5)
| Параметр | Цена | Примечание |
|---|---|---|
| Вход | $5.00 / 1M токенов | x2 от GPT-5.4 |
| Кешированный вход | $0.50 / 1M токенов | 1/10 от обычного входа |
| Выход | $30.00 / 1M токенов | x2 от GPT-5.4 |
| Длинные промпты (>272K токенов) | Вход x2, выход x1.5 | Применяется ко всей сессии |
| Batch API / Flex | Скидка 50% | Для асинхронных задач |
| Priority-обработка | x2.5 | Для требований к низкой латентности |
| Региональная обработка (data residency) | +10% | Под требования регуляторов |
Почему рост в 2 раза?
OpenAI прямо причины не объясняла, но наиболее вероятные таковы:
- Стоимость полного переобучения базовой модели — первая пересборка с нуля со времён GPT-4.5
- Закладывание прироста производительности в цену — серьёзный скачок на Terminal-Bench и других тестах
- Эффективность по токенам частично компенсирует — на 40% меньше выходных токенов сглаживает рост цены за единицу
Для задач с большим объёмом вывода реальный рост стоимости получается примерно «x2 × 0.6 = x1.2». А вот в задачах с большим объёмом ввода (суммаризация, анализ) удвоение бьёт в полную силу — это стоит учитывать.
6. Доступность по планам ChatGPT
| План | Стоимость | GPT-5.5 | GPT-5.5 Pro | Codex |
|---|---|---|---|---|
| Free | $0 | ❌ нет | ❌ нет | ❌ нет |
| Plus | $20/мес | ✅ есть | ❌ нет | ✅ есть |
| Pro | $200/мес | ✅ есть | ✅ есть | ✅ есть (включая Fast Mode) |
| Business | По потреблению | ✅ есть | ✅ есть | ✅ есть |
| Enterprise | По договорённости | ✅ есть | ✅ есть | ✅ есть |
Бесплатные пользователи остаются на GPT-5 (или 5.4)
На Free-плане GPT-5.5 недоступна — пользователи продолжают работать с GPT-5 (или 5.4). Нижний порог — Plus ($20/мес).
7. Спецификации API и возможности для разработчиков
Поддерживаемые возможности
- ✅ Function calling
- ✅ Структурированный вывод (Structured Outputs / JSON Schema)
- ✅ Стриминг
- ✅ Управление reasoning effort (none/low/medium/high/xhigh)
- ✅ Инструменты: веб-поиск, поиск по файлам, генерация изображений, Code Interpreter, Hosted Shell, Apply Patch, Skills, Computer Use, MCP, Tool Search
- ✅ Дистилляция (в меньшие модели)
- ❌ Файнтюнинг (на момент запуска не поддерживается)
- ❌ Аудио и видео на вход/выход (не поддерживаются)
Лимиты (Tier 5: максимальный)
- RPM (запросов в минуту): 15 000
- TPM (токенов в минуту): 40 000 000
- Лимит batch-очереди: 15 000 000 000
Пример вызова с reasoning effort (Python)
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.5",
reasoning={"effort": "high"}, # none/low/medium/high/xhigh
input="Реши эту сложную математическую задачу пошагово..."
)
print(response.output_text)
8. Интеграция с Codex и стратегия Super-app
Codex Fast Mode
Одновременно с релизом GPT-5.5 Codex получил Fast Mode:
- В 1.5 раза быстрее обработка
- В 2.5 раза дороже (по кредитам)
- Доступен на планах Pro / Business / Enterprise
Стратегия Super-app
OpenAI также представила концепцию «Super-app», объединяющего «ChatGPT + Codex + AI-браузер». Идея — поставлять всё это корпоративным клиентам единым пакетом, что в OpenAI называют «шагом к более agentic и более интуитивным вычислениям».
Концептуально это перенос принципа «всё в одной коробке для максимизации DX» из PaaS вроде Vercel и Next.js в область AI-агентов.
9. Подробное сравнение с Claude Opus 4.7 и Gemini 3.1 Pro
| Параметр | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Релиз | 23 апреля 2026 | 16 апреля 2026 | Начало 2026 |
| API вход | $5/MTok | $5/MTok | Не раскрывается |
| API выход | $30/MTok | $25/MTok | Не раскрывается |
| Контекст | 1 050K | 1 000K (200K стандарт) | 1 000K |
| Граница знаний | 1 декабря 2025 | ~начало 2025 | ~начало 2025 |
| Количество SOTA-бенчмарков | 14 | 4 | 2 |
| Terminal-Bench 2.0 | 82.7% | 69.4% | 68.5% |
| SWE-Bench Pro | 58.6% | 64.3% | — |
| FrontierMath T4 | 35.4% | 22.9% | 16.7% |
| Сильные стороны | Агенты, длинные задачи, управление ПК | Длинные кодинг-сессии, безопасность, длинные тексты | Мультимодальность, интеграция с Google Workspace |
Как выбрать
- Лучшая универсальная модель + передовые агентские возможности → GPT-5.5 (особенно если выход >$30/MTok приемлем)
- Долгий автономный кодинг и приоритет безопасности → Claude Opus 4.7 (выигрывает на SWE-Bench Pro и дешевле по выходу)
- Интеграция с Google Workspace и мультимодальность → Gemini 3.1 Pro
10. На что обратить внимание — склонность к «самоуверенности»
Независимый анализ (Handy AI) указывает у GPT-5.5 на склонность «уверенно отвечать о том, чего модель на самом деле не знает».
«Модель знает больше, но и о том, чего не знает, отвечает уверенее».
Сценарии повышенного риска
- ⚠️ Медицинская диагностика и назначения — ошибочная информация может стоить жизни
- ⚠️ Юридические консультации и поиск прецедентов — цитирование выдуманных дел нарушает профессиональную этику
- ⚠️ Финансовые советы и налоговые расчёты — риск регуляторных нарушений
- ⚠️ Цитаты в научных публикациях — известны случаи цитирования несуществующих статей
Способы снизить риск
- Обязательная проверка фактов — никогда не используйте вывод ИИ как есть, сверяйтесь с первоисточниками
- Используйте инструмент веб-поиска — пусть модель сама забирает актуальную информацию
- Сверяйте ответы с Claude Opus 4.7 — для критичной по точности работы прогоняйте ответы через несколько моделей
- Скажите модели говорить «не знаю» — в системном промпте: «если не уверена — заяви об этом явно»
11. Когда выбирать GPT-5.5 — по сценариям
✅ Выбирайте GPT-5.5, когда
- Нужны долгие автономные кодинг-агенты — Expert-SWE 73.1% — лучший результат в индустрии
- Автоматизация ПК / Computer Use — OSWorld 78.7%, на уровне Opus 4.7
- Автоматизация поддержки клиентов — Tau2-bench 98.0% — фактически безошибочно
- Сложная математика и научные исследования — FrontierMath T4 35.4% (заметно выше 22.9% у Opus 4.7)
- Вы строите всё на экосистеме OpenAI — интеграция с ChatGPT, Codex, Operator
❌ Лучше избегать GPT-5.5, когда
- Production-кодинг уровня SWE-Bench Pro — Claude Opus 4.7 по-прежнему впереди
- Работа, где точность критична (медицина, юриспруденция, финансы) — осторожно с галлюцинациями
- Цена — главный приоритет — выход $30/MTok относится к высокому ценовому сегменту
- Нужен бесплатный вариант — на Free-плане недоступна
- Обработка аудио или видео — поддерживается только текст и изображения на вход
FAQ
Q1. Когда GPT-5.5 стала доступна в ChatGPT?
23 апреля 2026 (по времени США) — на планах Plus, Pro, Business и Enterprise. GPT-5.5 Pro доступна только на Pro, Business и Enterprise.
Q2. Можно ли пользоваться GPT-5.5 на Free-плане?
Нет. Free остаётся на GPT-5 (или 5.4). Для доступа к GPT-5.5 нужен минимум Plus за $20/мес.
Q3. GPT-5.5 vs Claude Opus 4.7 — какая лучше?
В целом — GPT-5.5 (SOTA на 14 бенчмарках против 4 у Claude). Но на SWE-Bench Pro Claude Opus 4.7 выигрывает 64.3% против 58.6% — для production-кодинга преимущество у Claude. Кроме того, Claude дешевле по выходу ($25/MTok против $30/MTok у GPT-5.5).
Q4. API подорожал — как держать расходы под контролем?
Да, $5/$30 за MTok — вдвое больше, чем у GPT-5.4. Но расход выходных токенов снижается примерно на 40%, поэтому для задач с большим выводом реальный рост цены обычно укладывается в x1.2. Советы по экономии:
1. Используйте Batch API / Flex (скидка 50%)
2. Используйте кешированный вход ($0.50/MTok, 1/10 от обычного)
3. Применяйте reasoning.effort=low для лёгких задач
4. Избегайте промптов свыше 272K токенов
Q5. Чем GPT-5.5 Pro реально отличается?
У неё сильнее рассуждения — заметный прирост на сложной математике (FrontierMath: 35.4% → 39.6%) и научных задачах. Минус — цена API в 6 раз выше ($30 вход / $180 выход). Вне исследований и серьёзной работы над статьями соотношение цена/польза, как правило, не оправдывает себя.
Q6. Поддерживается ли файнтюнинг?
На апрель 2026 — нет. Зато поддерживается дистилляция (обучение меньших моделей по выходам), так что выводами GPT-5.5 можно обучать что-то вроде GPT-5 nano.
Q7. На что обратить внимание при использовании 1M контекста?
Промпты свыше 272K токенов запускают надбавку x2 на вход и x1.5 на выход на всю сессию. Если проектируете API под использование 1M токенов — посчитайте затраты заранее.
Q8. Какова граница знаний GPT-5.5?
1 декабря 2025. Всё, что произошло позже (с января 2026), в обучающие данные не попало — для актуальной информации фактически обязателен инструмент веб-поиска.
Q9. Стало ли меньше галлюцинаций?
Независимый анализ говорит: «база знаний выросла, но и уверенность в ответах о том, чего модель не знает, тоже». Официально OpenAI заявляет об улучшении безопасности, но в медицине, праве и финансах проверка фактов остаётся обязательной.
Q10. Будут ли мои существующие GPT-5-приложения работать без изменений?
Совместимость API сохранена — для миграции достаточно сменить идентификатор модели с gpt-5 на gpt-5.5. Однако чтобы воспользоваться новыми возможностями (например, параметром reasoning.effort или указанием ID Pro-версии), стоит пересмотреть архитектуру.
Итог: GPT-5.5 — «самая сильная, но не универсально лучшая»
GPT-5.5 удерживает SOTA на 14 бенчмарках и заметно опережает Claude Opus 4.7 и Gemini 3.1 Pro, возвращая себе первое место в индустрии. Особенно сильна она в агентских задачах, автоматизации ПК, долгом автономном кодинге и в математике и научных исследованиях.
В то же время на SWE-Bench Pro её всё ещё обходит Claude Opus 4.7, наблюдается склонность к «самоуверенным галлюцинациям», и цена API выросла в 2 раза — это не безусловная победа.
Умный подход — «выбирать подходящую модель — GPT-5.5, Claude Opus 4.7 или Gemini 3.1 Pro — под конкретную задачу». Если вы делаете ставку на экосистему OpenAI — GPT-5.5. Если важны длинные кодинг-сессии и безопасность — Claude. Если нужна интеграция с Google Workspace — Gemini. Мультимодельная работа становится стандартом 2026 года.
Связанные статьи
- Полный разбор релиза Claude Opus 4.7 — подробности о прямом конкуренте
- Гайд по миграции на Claude Opus 4.7 — переход с 4.6 на 4.7
- Сравнение цен Claude и ChatGPT — структуры тарифов обеих сторон
- Что такое Next.js? — React-фреймворк, который рекомендует ИИ