Claude Sonnet 5 — Sonnet, который наконец дотянулся до Opus

Claude Sonnet 5AnthropicАгентный AIBrowseCompOSWorldClaude CodeБезопасность AI

Anthropic выпустила модель, которая по словам самой компании 'близка по производительности к Opus 4.8, но при этом дешевле'. Разбираем, что изменилось.

Claude Sonnet 5 — новая модель Anthropic, обзор возможностей, цены и бенчмарков

30 июня Anthropic выпустила Claude Sonnet 5 и сразу поставила её на дефолт в бесплатном и Pro-тарифах Claude. Звучит как рутинное обновление номера версии, но за этим стоит более интересная история — компания признаёт прямо в заголовке поста, что именно Sonnet-модели когда-то открыли агентную эпоху для разработчиков. Sonnet 3.5, потом 3.6 и 3.7 — это были первые модели, которые реально умели программировать и пользоваться инструментами не хуже человека. А затем заметный прогресс на год сместился в сторону линейки Opus, и Sonnet начал ощущаться как 'модель для бюджета', а не для серьёзной работы.

Sonnet 5 — это попытка вернуть статус-кво. Anthropic прямо говорит, что новая модель 'близка по производительности к Opus 4.8', но дешевле. Не догнала полностью, разрыв остаётся, но он стал маленьким — настолько маленьким, что выбор между двумя моделями превращается в вопрос бюджета, а не возможностей.

Разберём по порядку — что на самом деле изменилось технически, сколько это стоит, что говорят те, кто уже тестировал модель в проде, и что Anthropic нашла во время проверки безопасности.

Чем Sonnet 5 отличается от обычного обновления версии

SWE-bench Pro — тест на реальные баги из открытых GitHub-репозиториев, агенту нужно найти причину и закрыть issue целиком — 63.2% против 58.1% у Sonnet 4.6 и 69.2% у Opus 4.8. Terminal-Bench 2.1 проверяет работу в настоящем терминале Linux — команды, дебаг, файловая система — 80.4% против 67.0% и 82.7%. Humanity's Last Exam, самый тяжёлый общий бенчмарк на рассуждение с вопросами уровня PhD по физике, биологии, математике, без инструментов — 43.2% против 34.6% и 49.8%, с доступом к поиску и коду — 57.4% против 46.8% и 57.9%. OSWorld-Verified оценивает работу модели с реальным компьютером — открыть приложение, кликнуть нужную кнопку, заполнить форму, как это делает человек — 81.2% против 78.5% и 83.4%. На каждом из пяти бенчмарков Sonnet 5 заметно прибавляет к 4.6 и почти дотягивается до Opus 4.8 — разрыв обычно укладывается в два-шесть процентных пунктов.

Таблица бенчмарков Claude Sonnet 5 — SWE-bench Pro, Terminal-Bench 2.1, Humanity's Last Exam, OSWorld-Verified, GDPval-AA v2 в сравнении с Sonnet 4.6 и Opus 4.8
Сравнение Claude Sonnet 5, Sonnet 4.6 и Opus 4.8 по пяти бенчмаркам. Источник: Anthropic.

Самое неожиданное число — не в кодировании. На GDPval-AA v2, бенчмарке для офисной интеллектуальной работы, Sonnet 5 набирает 1618 баллов — выше, чем у Opus 4.8 (1615), и заметно выше Sonnet 4.6 (1395). Деловые задачи на стыке аналитики, документов и презентаций — единственная категория из пяти, где младшая модель обходит старшую сестру, и Anthropic не прячет этот факт за обтекаемыми формулировками.

Партнёры по раннему доступу описывают разницу не цифрами, а поведением модели. Ruby-инженер Neel Chotai рассказал, как попросил Sonnet 5 разобраться с багом — модель сама написала тест для воспроизведения, исправила код, а затем откатила фикс, чтобы убедиться, что баг действительно возвращается без изменений. Никто её об этом не просил. Это именно то, что Anthropic называет 'агентностью' — не способность пройти бенчмарк, а привычка доводить задачу до проверенного результата без подсказок на каждом шаге.

Регулятор мышления — от low до xhigh

Технически интересная деталь анонса — управляемые уровни усилия (effort levels), которые доходят до отметки xhigh. Это не новая идея — у Claude уже было adaptive thinking, у моделей OpenAI o-серии — reasoning effort. Но именно на Sonnet 5 Anthropic строит вокруг этого параметра весь маркетинг цены, показывая на графике агентного поиска BrowseComp, как меняется качество при росте эффорта и стоимости запроса.

График зависимости результата на BrowseComp от стоимости запроса и эффорт-уровня — Claude Sonnet 5, Sonnet 4.6 и Opus 4.8
Доля решённых задач BrowseComp в зависимости от стоимости запроса на разных эффорт-уровнях (low → max). Источник: Anthropic.

Читается график так. На low Sonnet 5 решает задачу за ~$2.5, на xhigh — за ~$8 и доходит до 69.3% пройденных задач. Opus 4.8 в этом же тесте стартует с low уже за ~$5 на 67.6% и поднимается до 76% на max за ~$10. То есть Sonnet 5 на максимальном эффорте практически достаёт уровень, который Opus показывает на низком-среднем, и платит за это заметно меньше. У Sonnet 4.6 рост от увеличения эффорта почти не виден — линия держится в районе 61–64% независимо от уровня усилия. Получается, что главное отличие новой версии не в потолке качества, а в том, что Sonnet 5 реально умеет конвертировать дополнительный 'бюджет на размышление' в результат, а не просто тратить на него токены.

Смысл прост — разработчик выбирает не модель, а точку на кривой. Нужен быстрый и дешёвый ответ на рутинную задачу — берёшь low или medium. Нужно дотянуться до качества, близкого к Opus, на действительно сложном агентном сценарии — переключаешь на xhigh и платишь больше токенов за один запрос, но не переключаешься на другую модель и не переписываешь промпт.

На практике это удобнее, чем кажется. Раньше выбор между Sonnet и Opus был архитектурным решением — какую модель прописывать в роутере запросов. Теперь это runtime-параметр, который можно менять прямо в зависимости от сложности конкретной задачи в очереди.

Цена $2 за вход и почему она не растёт сразу до $3

Через Claude Platform и Claude API модель доступна по идентификатору claude-sonnet-5 за $2 за 1M входных токенов и $10 за 1M выходных — это вступительная цена до 31 августа 2026 года. После этой даты цена поднимется до стандартных $3 и $15 за 1M токенов.

Здесь есть нюанс, который легко упустить. Sonnet 5 использует обновлённый токенизатор — тот же подход, что Anthropic уже применяла на Opus 4.7. Один и тот же текст теперь превращается в большее количество токенов, рост в 1.0–1.35 раза зависит от типа контента. Вступительная цена подобрана так, чтобы переход на новый токенизатор был примерно нейтральным по итоговым расходам — иначе компания могла бы просто оставить старую цену за токен и получить скрытое удорожание для всех клиентов.

Заодно Anthropic подняла лимиты запросов в Chat, Cowork, Claude Code и на Platform — это логичное следствие более высоких эффорт-уровней, которые сами по себе тратят больше токенов на запрос. Если до этого вы упирались в rate limit на xhigh-эффорте у предыдущих моделей, сейчас должно стать свободнее.

Почему все вокруг вдруг заговорили про агентность именно сейчас

Соучредитель Cursor Sualeh Asif формулирует короче всех — с Sonnet 5 агенты дольше остаются в рамках плана, следуют конвенциям проекта и доводят многошаговые изменения до конца при разумной цене. Это ровно то качество, которого не хватало предыдущим Sonnet-моделям на действительно длинных задачах — они начинали уверенно, а потом теряли нить плана к третьему-четвёртому шагу.

Senior-инженер Daniel Shepard описывает конкретный кейс — двухчастная задача: обновить уровни аккаунтов в Salesforce и отправить анонс запуска корпоративным контактам. Раньше такие связки застревали посередине, модель выполняла первую часть и теряла контекст или мотивацию на второй. Sonnet 5 прошла оба шага до конца без перезапуска.

Со-основатель Lovable Fabian Hedin отмечает другую сторону агентности — модель получает больше реальной нагрузки с меньшим числом промежуточных шагов, и при этом стабильно отказывается от небезопасных запросов. Для платформы, которая раздаёт мощные инструменты миллионам непрограммистов, второе свойство не менее важно, чем скорость.

Безопаснее предшественника, но не самая безопасная в семье

Предрелизные тесты безопасности показали улучшение по сравнению с Sonnet 4.6 — модель лучше отказывает на злонамеренные запросы, устойчивее к попыткам перехвата через prompt injection в агентных сценариях, реже галлюцинирует и реже подлизывается под мнение собеседника. По автоматизированному поведенческому аудиту, который проверяет широкий спектр нежелательного поведения, Sonnet 5 показала более низкий уровень проблем, чем 4.6.

Но есть честная оговорка прямо в отчёте Anthropic — по этому же аудиту Sonnet 5 показывает чуть более высокий уровень нежелательного поведения, чем у Opus 4.8 и предварительной версии Mythos. Прогресс есть, но он не делает Sonnet самой безопасной моделью в линейке — это по-прежнему роль Opus.

На кибербезопасности модель специально не обучали — и это видно по результатам. В оценке на разработку эксплойтов для реальных уязвимостей Firefox 147 (тест подготовлен совместно с Mozilla, уязвимости уже закрыты в Firefox 148) ни Sonnet 5, ни Sonnet 4.6 не довели ни один эксплойт до рабочего состояния — 0% полного успеха у обеих версий. У Sonnet 5 чуть выше доля частичного успеха, чем у 4.6, но Anthropic прямо объясняет это общим ростом интеллекта модели, а не целевой тренировкой на хакерские задачи. Для сравнения, у моделей класса Opus возможности в этой области заметно выше.

Из-за небольшого роста кибернавыков по умолчанию включены те же защитные механизмы, что стоят на Opus 4.7 и 4.8 — они отслеживают и блокируют опасное использование в реальном времени. Это мягче, чем ограничения, с которыми вышла модель Fable 5, потому что общий уровень риска от Sonnet 5 оценён как низкий.

Доступ из России без VPN и что писать в коде

Anthropic, как и большинство американских AI-компаний, ограничивает прямой доступ из России — запрос на официальный API возвращает ошибку 403 или 451. AITUNNEL даёт OpenAI-совместимый доступ к Claude Sonnet 5 с оплатой в рублях и без VPN — юридическая регистрация в РФ, пополнение картой российского банка или по счёту для юрлиц.

Интеграция — это смена одной переменной окружения. Base_url меняется на https://api.aitunnel.ru/v1/, в поле модели указывается claude-sonnet-5. Остальной код, включая streaming, tool use, vision-запросы и Prompt Caching, работает без изменений в логике.

По курсу, который AITUNNEL применяет к остальным моделям Claude, вступительная цена Sonnet 5 ориентировочно укладывается в 180 ₽ за 1M входных токенов и 900 ₽ за 1M выходных — то есть на уровне Sonnet 4.6. После 31 августа, когда официальная цена поднимется до $3/$15, ориентир по рублям такой же, как сейчас у Sonnet 4.6 — около 270 ₽ и 1 350 ₽ соответственно. Точные актуальные цифры всегда смотрите в калькуляторе на странице провайдера, курс и наценка платформы могут меняться.

Claude Sonnet 5

Главное обновление линейки
30 июня 2026Контекст: 1 000 000 токеновВывод: 128 000 токенов

Самая агентная модель в истории линейки Sonnet. Anthropic описывает её как модель, чья производительность близка к Opus 4.8 при заметно более низкой цене. Доступна сразу на всех тарифах — от Free до Enterprise, в Claude Code и через Claude Platform по идентификатору claude-sonnet-5.

Ключевые преимущества

  • 63.2% на SWE-bench Pro и 80.4% на Terminal-Bench 2.1 — рядом с Opus 4.8
  • 1618 на GDPval-AA v2 — выше, чем у Opus 4.8 (1615)
  • Эффорт-уровни от low до xhigh — гибкий баланс скорости и качества
  • Ниже уровень галлюцинаций и подлизывания ответов, чем у Sonnet 4.6
  • Лучше держится против перехвата агента через prompt injection
  • Доступна сразу на всех тарифах без поэтапного раскатывания

Подходит для

  • Многошаговая бизнес-автоматизация без ручного контроля на каждом шаге
  • Долгие агентные сессии, где модель сама проверяет результат своей работы
  • Production-кодинг на запущенных проектах — race conditions, скрытые баги, легаси
  • Задачи computer use и работа с браузером, где Opus избыточно дорог

Итог

Claude Sonnet 5 не пытается стать новым Opus — она пытается стать Sonnet, которому больше не нужно извиняться за разницу с флагманом. Эффорт-уровни от low до xhigh дают разработчику прямой контроль над балансом цена-качество без смены модели в коде, обновлённый токенизатор и вступительная цена $2/$10 за 1M токенов делают переход почти бесшовным по деньгам, а истории про самостоятельную проверку результата и доведённые до конца многошаговые задачи объясняют, почему партнёры в один голос говорят про другой уровень агентности. Безопасность выросла относительно 4.6, но осталась на ступень ниже, чем у Opus 4.8 — и Anthropic не скрывает это в собственном отчёте. Для большинства production-сценариев, где раньше выбор стоял между дорогим Opus и недотягивающим Sonnet, теперь есть третий вариант — взять Sonnet 5 и просто прибавить эффорт там, где он действительно нужен.

Часто задаваемые вопросы

Чем Claude Sonnet 5 отличается от Sonnet 4.6

Главное отличие — производительность, которая по описанию Anthropic близка к Opus 4.8, а не к предыдущим Sonnet-моделям. Добавлены управляемые эффорт-уровни от low до xhigh, снижены показатели галлюцинаций и подлизывания, выросла устойчивость к prompt injection в агентных сценариях. Используется новый токенизатор, из-за которого один и тот же текст превращается в 1.0–1.35 раза больше токенов.

Сколько стоит Claude Sonnet 5 в API

$2 за 1M входных токенов и $10 за 1M выходных — вступительная цена, действует до 31 августа 2026 года. После этой даты стандартная цена составит $3 и $15 за 1M токенов соответственно. Идентификатор модели в API — claude-sonnet-5.

Как подключить Claude Sonnet 5 из России без VPN

Через AITUNNEL: зарегистрируйтесь, пополните баланс, получите API-ключ и укажите base_url = "https://api.aitunnel.ru/v1/", модель — claude-sonnet-5. Оплата в рублях картой российского банка или по счёту для юрлиц, без VPN и зарубежных карт.

Безопасна ли Sonnet 5 для агентных сценариев

По данным Anthropic, модель безопаснее Sonnet 4.6 — лучше отказывает на злонамеренные запросы и устойчивее к попыткам перехвата агента. При этом по автоматизированному поведенческому аудиту она показывает чуть более высокий уровень нежелательного поведения, чем Opus 4.8. На кибербезопасность модель специально не обучали, в тесте на эксплойты Firefox 147 ни одна из Sonnet-версий не довела эксплойт до рабочего состояния.

Где доступна Claude Sonnet 5

Сразу на всех тарифах Claude — Free и Pro (как модель по умолчанию), а также Max, Team и Enterprise. Доступна в Claude Code и через Claude Platform по идентификатору claude-sonnet-5, а из России — через совместимый API на AITUNNEL.

Доступ к этому провайдеру через AITUNNEL

Все модели провайдера доступны через единый API. Работает из России без VPN, оплата в рублях.

Единый APIОплата картой РФБез VPN
Начать работуРегистрация за 1 минуту

Статьи по теме

ПопробоватьВсе модели