Один из первых вопросов при работе с Claude: «Что выбрать — Opus, Sonnet или Haiku?»

API-цены трёх моделей различаются до 5 раз, и разница в производительности очевидна. Но самая дорогая модель — не всегда лучший выбор. Для одних задач практичнее Haiku, а другие действительно требуют Opus.

В этой статье мы сравниваем актуальные цены, производительность и скорость по состоянию на апрель 2026 года, а также приводим расчёты стоимости по типам задач.

1. Три модели: обзор

Три модели Claude: Opus (максимальная производительность), Sonnet (баланс), Haiku (скорость и экономия)
МодельПозиционированиеДата выпускаКратко
Opus 4.6ФлагманФев 2026Самый интеллектуальный. Для агентов и сложного кода
Sonnet 4.6СбалансированныйФев 2026Лучший баланс скорости и интеллекта. Для повседневных задач
Haiku 4.5Быстрый и доступныйОкт 2025Самый быстрый. Для массовых и реалтайм-задач

Названия отражают литературный масштаб. Opus (крупное произведение) означает глубокое мышление, sonnet (14-строчное стихотворение) — сбалансированный подход, а haiku (трёхстрочное стихотворение) — быстрые и лаконичные ответы.

2. Сравнение цен API

Сравнение API-цен Claude Opus, Sonnet и Haiku: ввод, вывод, пакетная обработка и кэширование

Стандартные цены (за миллион токенов)

МодельВводВыводПакет (ввод)Пакет (вывод)Кэш
Opus 4.6$5$25$2,50$12,50$0,50
Sonnet 4.6$3$15$1,50$7,50$0,30
Haiku 4.5$1$5$0,50$2,50$0,10

Разница между самым дорогим (вывод Opus — $25/MTok) и самым дешёвым (вывод Haiku — $5/MTok) составляет 5 раз. При этом Opus 4.6 в 3 раза дешевле предшественника (у Opus 4.1 вывод стоил $75/MTok).

Советы по снижению затрат

Batch API снижает стоимость вдвое, а попадание в кэш уменьшает стоимость ввода в 10 раз. Комбинируя оба метода, можно сэкономить до 95%. При массовой обработке обязательно изучите эти варианты.

Что такое «токен»?

Цены API указываются в «токенах». Для английского текста примерно 1 слово ≈ 1,3 токена. Миллион токенов — это около 750 000 слов, примерно 10 романов средней длины.

3. Тарифные планы подписки

Ежемесячная подписка предлагает принципиально иную ценовую модель по сравнению с API-оплатой по факту использования.

ПланЦенаДоступные моделиПо умолчанию
Free$0Только Sonnet 4.5Sonnet 4.5
Pro$20/месВсе моделиSonnet 4.6
Max 5x$100/месВсе моделиOpus 4.6
Max 20x$200/месВсе моделиOpus 4.6

Подписка не «безлимитная» — есть ограничения на использование. Тем не менее она в 15–30 раз дешевле API. Один пользователь сообщил, что за 8 месяцев потребил 10 миллиардов токенов — по API-ценам это обошлось бы более чем в $15 000, а подписка Max стоила около $800.

Переключение моделей в Claude Code

В Claude Code можно выбрать модель при запуске: claude --model opus или claude --model sonnet, а во время сессии — командой /model sonnet. У плана Pro по умолчанию Sonnet, у Max — Opus. Подробнее о Claude Code — в статье Claude Chat, Cowork и Code: в чём разница.

4. Бенчмарки производительности

БенчмаркЧто измеряетOpus 4.6Sonnet 4.6Разрыв
SWE-bench VerifiedНавыки кодирования80,8%79,6%Всего 1,2 п.
GPQA DiamondНаучные рассуждения91,3%74,1%17,2 п.
OSWorld-VerifiedАвтоматизация GUI72,7%72,5%Почти равны
MathМатематические задачи89%

Главный вывод: разрыв в кодировании составляет всего 1,2 балла. Sonnet 4.6 — первый Sonnet в истории Claude, сравнявшийся с Opus предыдущего поколения по бенчмаркам кодирования.

Однако в научных рассуждениях (GPQA Diamond) разрыв составляет 17,2 балла, что делает Opus безоговорочным лидером в академическом анализе и сложных логических задачах.

Официальных бенчмарков для Haiku 4.5 немного, но Anthropic позиционирует его как модель с «интеллектом, близким к передовому уровню». Для простых задач ожидается точность, приближающаяся к уровню Sonnet.

5. Скорость и контекстные окна

МодельСкорость (прибл.)Контекстное окноМакс. вывод
Opus 4.6~20–30 ток/сек1M токенов128K токенов
Sonnet 4.6~40–60 ток/сек1M токенов64K токенов
Haiku 4.5В 2–5 раз быстрее Sonnet200K токенов64K токенов

Главное преимущество Haiku — скорость. У него самое короткое время до первого токена (TTFT), что идеально для чат-ботов реального времени и автодополнения.

Opus предлагает контекстное окно в 1 миллион токенов (примерно 10–20 романов) для задач вроде обработки целых кодовых баз за один раз. Его максимальный вывод 128K токенов вдвое больше, чем у Sonnet/Haiku, что подходит для генерации длинных документов за один проход.

6. Расчёт стоимости по сценариям

Вот примерная стоимость типичных задач по стандартным API-ценам (без кэширования и пакетной обработки).

Сценарий 1: Генерация статьи на 2 000 слов

Ввод: ~1 000 токенов, вывод: ~2 700 токенов

МодельСтоимость вводаСтоимость выводаИтого
Opus 4.6$0,005$0,068~$0,07
Sonnet 4.6$0,003$0,041~$0,04
Haiku 4.5$0,001$0,014~$0,02

Сценарий 2: Чтение и рефакторинг кода

Ввод: ~10 000 токенов (код + инструкции), вывод: ~5 000 токенов

МодельСтоимость вводаСтоимость выводаИтого
Opus 4.6$0,05$0,125~$0,18
Sonnet 4.6$0,03$0,075~$0,11
Haiku 4.5$0,01$0,025~$0,04

Сценарий 3: Чат-бот, 1 000 запросов в день

200 токенов ввода + 300 токенов вывода на запрос x 1 000

МодельСтоимость в деньВ месяц (30 дней)
Opus 4.6$8,50$255
Sonnet 4.6$5,10$153
Haiku 4.5$1,70$51

Для массовых сценариев вроде чат-ботов ежемесячная разница между Haiku и Opus превышает $200. Практичный подход — использовать Haiku по умолчанию и направлять только сложные запросы на Sonnet или Opus.

7. Какую модель выбрать?

Схема выбора модели: Opus, Sonnet или Haiku в зависимости от сложности задачи и объёма
Сценарий использованияРекомендацияПочему
Ежедневное кодирование и написание текстовSonnet 4.698% качества кодирования Opus, на 40% дешевле, вдвое быстрее
Масштабный рефакторингOpus 4.6Контекст 1M токенов и вывод 128K — здесь это решает
Академический анализOpus 4.6Разрыв 17 баллов в GPQA. Глубокие рассуждения не заменить
Чат-боты и поддержкаHaiku 4.5Самый быстрый и дешёвый. Идеален для типовых ответов
Пакетная обработкаHaiku 4.5Стоимость в 5 раз ниже, эффективно справляется с объёмами
Разработка в Claude CodeSonnet 4.6Достаточно плана Pro. Opus — только для сложной архитектуры

Практический совет

Если сомневаетесь — начните с Sonnet. Он справляется с большинством задач. Переходите на Opus, когда качество Sonnet недостаточно, и на Haiku — для простых повторяющихся задач. Такой ступенчатый подход обеспечит лучшее соотношение цены и качества.

FAQ

Насколько велика разница в кодировании между Opus и Sonnet?

По результатам SWE-bench Verified (бенчмарк кодирования) Opus 4.6 набирает 80,8%, а Sonnet 4.6 — 79,6%, разница всего 1,2 балла. В повседневном кодировании разница почти незаметна. С учётом разницы в цене ($25 против $15/MTok за вывод) Sonnet предлагает лучшее соотношение цена-качество. Тем не менее Opus имеет явное преимущество в проектировании крупных архитектур и задачах со сложными рассуждениями.

Что выгоднее — подписка или оплата API по факту?

При регулярном использовании подписка значительно дешевле — примерно в 15–30 раз выгоднее API. Даже план Pro ($20/мес) при эквивалентном использовании через API обошёлся бы в $180+ в месяц. API-оплата оправдана только при очень редком использовании или специфических сценариях пакетной обработки. Для сравнения с ChatGPT смотрите статью Сравнение цен Claude и ChatGPT.

Насколько «умён» Haiku 4.5?

Anthropic характеризует его как модель с «интеллектом, близким к передовому уровню». Хотя официальных бенчмарков немного, ожидается, что для простых задач — классификации, краткого изложения и ответов на вопросы — он приближается к точности Sonnet. Для сложных рассуждений или генерации длинного кода разрыв с Sonnet/Opus становится заметным. При стоимости в 5 раз ниже он идеален, когда приоритет — «достаточное качество в большом масштабе».

Подешевел ли Opus 4.6 по сравнению с прошлыми версиями?

Да, существенно. Opus 4.1 стоил $75/MTok за вывод, а Opus 4.6 — $25/MTok, то есть цена снизилась в 3 раза при улучшении производительности. Контекстное окно также расширилось с 200K до 1 миллиона токенов (в 5 раз), что значительно повысило ценность модели.