Содержание
Один из первых вопросов при работе с Claude: «Что выбрать — Opus, Sonnet или Haiku?»
API-цены трёх моделей различаются до 5 раз, и разница в производительности очевидна. Но самая дорогая модель — не всегда лучший выбор. Для одних задач практичнее Haiku, а другие действительно требуют Opus.
В этой статье мы сравниваем актуальные цены, производительность и скорость по состоянию на апрель 2026 года, а также приводим расчёты стоимости по типам задач.
1. Три модели: обзор
| Модель | Позиционирование | Дата выпуска | Кратко |
|---|---|---|---|
| Opus 4.6 | Флагман | Фев 2026 | Самый интеллектуальный. Для агентов и сложного кода |
| Sonnet 4.6 | Сбалансированный | Фев 2026 | Лучший баланс скорости и интеллекта. Для повседневных задач |
| Haiku 4.5 | Быстрый и доступный | Окт 2025 | Самый быстрый. Для массовых и реалтайм-задач |
Названия отражают литературный масштаб. Opus (крупное произведение) означает глубокое мышление, sonnet (14-строчное стихотворение) — сбалансированный подход, а haiku (трёхстрочное стихотворение) — быстрые и лаконичные ответы.
2. Сравнение цен API
Стандартные цены (за миллион токенов)
| Модель | Ввод | Вывод | Пакет (ввод) | Пакет (вывод) | Кэш |
|---|---|---|---|---|---|
| Opus 4.6 | $5 | $25 | $2,50 | $12,50 | $0,50 |
| Sonnet 4.6 | $3 | $15 | $1,50 | $7,50 | $0,30 |
| Haiku 4.5 | $1 | $5 | $0,50 | $2,50 | $0,10 |
Разница между самым дорогим (вывод Opus — $25/MTok) и самым дешёвым (вывод Haiku — $5/MTok) составляет 5 раз. При этом Opus 4.6 в 3 раза дешевле предшественника (у Opus 4.1 вывод стоил $75/MTok).
Советы по снижению затрат
Batch API снижает стоимость вдвое, а попадание в кэш уменьшает стоимость ввода в 10 раз. Комбинируя оба метода, можно сэкономить до 95%. При массовой обработке обязательно изучите эти варианты.
Что такое «токен»?
Цены API указываются в «токенах». Для английского текста примерно 1 слово ≈ 1,3 токена. Миллион токенов — это около 750 000 слов, примерно 10 романов средней длины.
3. Тарифные планы подписки
Ежемесячная подписка предлагает принципиально иную ценовую модель по сравнению с API-оплатой по факту использования.
| План | Цена | Доступные модели | По умолчанию |
|---|---|---|---|
| Free | $0 | Только Sonnet 4.5 | Sonnet 4.5 |
| Pro | $20/мес | Все модели | Sonnet 4.6 |
| Max 5x | $100/мес | Все модели | Opus 4.6 |
| Max 20x | $200/мес | Все модели | Opus 4.6 |
Подписка не «безлимитная» — есть ограничения на использование. Тем не менее она в 15–30 раз дешевле API. Один пользователь сообщил, что за 8 месяцев потребил 10 миллиардов токенов — по API-ценам это обошлось бы более чем в $15 000, а подписка Max стоила около $800.
Переключение моделей в Claude Code
В Claude Code можно выбрать модель при запуске: claude --model opus или claude --model sonnet, а во время сессии — командой /model sonnet. У плана Pro по умолчанию Sonnet, у Max — Opus. Подробнее о Claude Code — в статье Claude Chat, Cowork и Code: в чём разница.
4. Бенчмарки производительности
| Бенчмарк | Что измеряет | Opus 4.6 | Sonnet 4.6 | Разрыв |
|---|---|---|---|---|
| SWE-bench Verified | Навыки кодирования | 80,8% | 79,6% | Всего 1,2 п. |
| GPQA Diamond | Научные рассуждения | 91,3% | 74,1% | 17,2 п. |
| OSWorld-Verified | Автоматизация GUI | 72,7% | 72,5% | Почти равны |
| Math | Математические задачи | — | 89% | — |
Главный вывод: разрыв в кодировании составляет всего 1,2 балла. Sonnet 4.6 — первый Sonnet в истории Claude, сравнявшийся с Opus предыдущего поколения по бенчмаркам кодирования.
Однако в научных рассуждениях (GPQA Diamond) разрыв составляет 17,2 балла, что делает Opus безоговорочным лидером в академическом анализе и сложных логических задачах.
Официальных бенчмарков для Haiku 4.5 немного, но Anthropic позиционирует его как модель с «интеллектом, близким к передовому уровню». Для простых задач ожидается точность, приближающаяся к уровню Sonnet.
5. Скорость и контекстные окна
| Модель | Скорость (прибл.) | Контекстное окно | Макс. вывод |
|---|---|---|---|
| Opus 4.6 | ~20–30 ток/сек | 1M токенов | 128K токенов |
| Sonnet 4.6 | ~40–60 ток/сек | 1M токенов | 64K токенов |
| Haiku 4.5 | В 2–5 раз быстрее Sonnet | 200K токенов | 64K токенов |
Главное преимущество Haiku — скорость. У него самое короткое время до первого токена (TTFT), что идеально для чат-ботов реального времени и автодополнения.
Opus предлагает контекстное окно в 1 миллион токенов (примерно 10–20 романов) для задач вроде обработки целых кодовых баз за один раз. Его максимальный вывод 128K токенов вдвое больше, чем у Sonnet/Haiku, что подходит для генерации длинных документов за один проход.
6. Расчёт стоимости по сценариям
Вот примерная стоимость типичных задач по стандартным API-ценам (без кэширования и пакетной обработки).
Сценарий 1: Генерация статьи на 2 000 слов
Ввод: ~1 000 токенов, вывод: ~2 700 токенов
| Модель | Стоимость ввода | Стоимость вывода | Итого |
|---|---|---|---|
| Opus 4.6 | $0,005 | $0,068 | ~$0,07 |
| Sonnet 4.6 | $0,003 | $0,041 | ~$0,04 |
| Haiku 4.5 | $0,001 | $0,014 | ~$0,02 |
Сценарий 2: Чтение и рефакторинг кода
Ввод: ~10 000 токенов (код + инструкции), вывод: ~5 000 токенов
| Модель | Стоимость ввода | Стоимость вывода | Итого |
|---|---|---|---|
| Opus 4.6 | $0,05 | $0,125 | ~$0,18 |
| Sonnet 4.6 | $0,03 | $0,075 | ~$0,11 |
| Haiku 4.5 | $0,01 | $0,025 | ~$0,04 |
Сценарий 3: Чат-бот, 1 000 запросов в день
200 токенов ввода + 300 токенов вывода на запрос x 1 000
| Модель | Стоимость в день | В месяц (30 дней) |
|---|---|---|
| Opus 4.6 | $8,50 | $255 |
| Sonnet 4.6 | $5,10 | $153 |
| Haiku 4.5 | $1,70 | $51 |
Для массовых сценариев вроде чат-ботов ежемесячная разница между Haiku и Opus превышает $200. Практичный подход — использовать Haiku по умолчанию и направлять только сложные запросы на Sonnet или Opus.
7. Какую модель выбрать?
| Сценарий использования | Рекомендация | Почему |
|---|---|---|
| Ежедневное кодирование и написание текстов | Sonnet 4.6 | 98% качества кодирования Opus, на 40% дешевле, вдвое быстрее |
| Масштабный рефакторинг | Opus 4.6 | Контекст 1M токенов и вывод 128K — здесь это решает |
| Академический анализ | Opus 4.6 | Разрыв 17 баллов в GPQA. Глубокие рассуждения не заменить |
| Чат-боты и поддержка | Haiku 4.5 | Самый быстрый и дешёвый. Идеален для типовых ответов |
| Пакетная обработка | Haiku 4.5 | Стоимость в 5 раз ниже, эффективно справляется с объёмами |
| Разработка в Claude Code | Sonnet 4.6 | Достаточно плана Pro. Opus — только для сложной архитектуры |
Практический совет
Если сомневаетесь — начните с Sonnet. Он справляется с большинством задач. Переходите на Opus, когда качество Sonnet недостаточно, и на Haiku — для простых повторяющихся задач. Такой ступенчатый подход обеспечит лучшее соотношение цены и качества.
FAQ
Насколько велика разница в кодировании между Opus и Sonnet?
По результатам SWE-bench Verified (бенчмарк кодирования) Opus 4.6 набирает 80,8%, а Sonnet 4.6 — 79,6%, разница всего 1,2 балла. В повседневном кодировании разница почти незаметна. С учётом разницы в цене ($25 против $15/MTok за вывод) Sonnet предлагает лучшее соотношение цена-качество. Тем не менее Opus имеет явное преимущество в проектировании крупных архитектур и задачах со сложными рассуждениями.
Что выгоднее — подписка или оплата API по факту?
При регулярном использовании подписка значительно дешевле — примерно в 15–30 раз выгоднее API. Даже план Pro ($20/мес) при эквивалентном использовании через API обошёлся бы в $180+ в месяц. API-оплата оправдана только при очень редком использовании или специфических сценариях пакетной обработки. Для сравнения с ChatGPT смотрите статью Сравнение цен Claude и ChatGPT.
Насколько «умён» Haiku 4.5?
Anthropic характеризует его как модель с «интеллектом, близким к передовому уровню». Хотя официальных бенчмарков немного, ожидается, что для простых задач — классификации, краткого изложения и ответов на вопросы — он приближается к точности Sonnet. Для сложных рассуждений или генерации длинного кода разрыв с Sonnet/Opus становится заметным. При стоимости в 5 раз ниже он идеален, когда приоритет — «достаточное качество в большом масштабе».
Подешевел ли Opus 4.6 по сравнению с прошлыми версиями?
Да, существенно. Opus 4.1 стоил $75/MTok за вывод, а Opus 4.6 — $25/MTok, то есть цена снизилась в 3 раза при улучшении производительности. Контекстное окно также расширилось с 200K до 1 миллиона токенов (в 5 раз), что значительно повысило ценность модели.