Обновление Anthropic: Claude Opus 4 и Claude Sonnet 4: что умеют и как работают

Anthropic представил две новые модели ИИ, которые стали лидерами в программировании и решении сложных задач. Давайте разберемся, чем они отличаются и как их можно использовать.
Основные возможности
Claude Opus 4 — «тяжеловес» для сложных задач
Представьте себе ИИ-помощника, который не просто отвечает на вопросы, а реально думает над решением. Вот что умеет Opus 4:
Работает автономно
Модель может непрерывно трудиться до 7 часов без перерывов. Например:
- Переделывает старые системы кода (как будто опытный программист улучшает чужой проект)
- Самостоятельно согласовывает задачи между отделами компании (отдел разработки ↔ тестирование ↔ документации)
- Пока Opus работает, вы можете заниматься другими делами — он не требует постоянного контроля.
Opus 4 — анализирует и продумывает шаги
На пример, в задаче «Напиши API для онлайн-банка»
Спросит уточнения: «Нужна ли двухфакторная аутентификация?»
Нарисует схему: «Сначала модуль авторизации, потом транзакции…»
Проверит: «А если пользователь введёт буквы вместо цифр?»
Только после этого начнёт писать код — как живой разработчик.
Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!
Видит «большую картину»
Модель работает с текстовыми блоками размером до 32 тыс. «слов» (токенов). Это как:
- Переписать за раз целый файл кода (вместо правки отдельных строк)
- Создать документацию для сложной системы (от установки до FAQ)
- Держать в голове все детали проекта, даже если вы обсуждаете его неделю.
Claude Sonnet 4 — «рабочая лошадка» для повседневных задач:
- Оптимизация кода: Проводит ревью, ищет баги, предлагает улучшения. Например, проверяет, нет ли race conditions в Swift-коде.
- Быстрые ответы: Подходит для CI/CD-пайплайнов, генерации контента или интеграции API. Если Opus 4 — это архитектор, то Sonnet 4 — инженер, который быстро закрывает тикеты.
- Экономичность: Дешевле Opus 4, но при этом на 65% реже использует «лазейки» для упрощения задач по сравнению с предыдущими версиями.
Что принципиально нового?
Побеждают в бенчмарках: Opus 4 обходит GPT-4.1, Gemini 2.5 Pro и другие модели в тестах на кодогенерацию и решение математических задач.

Честное выполнение задач: Раньше ИИ часто искал shortcuts (например, писал код с упрощениями), но Claude 4 на 65% реже так делает. Если попросить его написать безопасный аутентификационный модуль, он учтёт даже edge cases вроде timing-атак.
Сравнение Claude Opus 4 с Claude 3 Opus
Характеристика | Claude Opus 4 | Claude 3 Opus |
Описание | Самая производительная модель Anthropic | Мощная модель для сложных задач |
Сильные стороны | Высочайший уровень интеллекта и возможностей | Высочайший уровень интеллекта, беглости и понимания |
Дата выпуска | 22 мая 2025 г. | 4 марта 2024 г. |
Многоязычность | Да | Да |
Визуальные возможности | Да | Да |
Расширенные рассуждения | Да | Нет |
Название модели API | claude-opus-4-20250514 | claude-3-opus-20240229 |
Сравнительная задержка | Умеренно быстрая | Умеренно быстрая |
Контекстное окно | 200K токенов | 200K токенов |
Макс. выходных токенов | 32 000 | 4 096 |
Дата обновления обучающих данных | Март 2025 г. | Август 2023 г. |
Ключевые результаты бенчмарков: | ||
* MMLU | «Высокая производительность» | 86.8% (5-shot), 88.2% (5-shot CoT), 85.7% (0-shot CoT) |
* GPQA | «Высокая производительность» | 50.4% (0-shot CoT) |
* SWE-bench | «Лидирующие в отрасли результаты», «лидер по SWE-bench» | Конкретных данных нет, но семейство Claude 3 улучшило кодирование |
* MATH | Данные не предоставлены | 60.1% (0-shot CoT) |
* HumanEval | Данные не предоставлены | 84.9% (0-shot) |
* MMMU | Данные не предоставлены | 59.4% |
Цена (Вход/Выход за MTok) | $15/$75 | $15/$75 |
Гибкое мышление: У моделей есть два режима — «быстрый ответ» (для чатов) и «глубокий анализ» (для многошаговых задач). Например, в режиме глубокого анализа Claude может сначала провести веб-поиск, потом сгенерировать код, а затем проверить его через песочницу Python.
Сравнение Claude Sonnet 4 с Claude Sonnet 3.7 / 3.5 Sonnet
Характеристика | Claude Sonnet 4 | Claude Sonnet 3.7 | Claude 3.5 Sonnet (обновленный) |
Описание | Высокопроизводительная модель | Высокопроизводительная модель с ранними расширенными рассуждениями | Предыдущая интеллектуальная модель Anthropic |
Сильные стороны | Высокий интеллект и сбалансированная производительность | Высокий интеллект с переключаемыми расширенными рассуждениями | Высокий уровень интеллекта и возможностей |
Дата выпуска | 22 мая 2025 г. | 24 февраля 2025 г. | 22 октября 2024 г. (обновление), Июнь 2024 г. (оригинал) |
Многоязычность | Да | Да | Да |
Визуальные возможности | Да | Да | Да |
Расширенные рассуждения | Да | Да (переключаемые/ранние) | Нет |
Название модели API | claude-sonnet-4-20250514 | claude-3-7-sonnet-20250219 | claude-3-5-sonnet-20241022 |
Сравнительная задержка | Быстрая | Быстрая | Быстрая |
Контекстное окно | 200K токенов | 200K токенов | 200K токенов |
Макс. выходных токенов | 64 000 | 64 000 (до 128K с бета-заголовком) | 8 192 |
Дата обновления обучающих данных | Март 2025 г. | Ноябрь 2024 г. (знания до октября 2024 г.) | Апрель 2024 г. |
Ключевые результаты бенчмарков: | |||
* MMLU | 80.2% (стандартный режим, официальные данные) | 83.2%, 86.1% (расшир. рассужд.), 89.7%, 80.3% | 86.2% |
* SWE-bench Verified | «Лидирует по SWE-bench Verified» (для моделей Claude 4) | 70.3% (со спец. подготовкой) | 49% |
* MATH | Данные не предоставлены | 82.2%, 96.2% (расшир. рассужд.) | Н/Д |
* HumanEval | Данные не предоставлены | 82.4% | 78.1% |
* TAU-bench | Данные не предоставлены | Передовые результаты, 81.2% | Н/Д |
Цена (Вход/Выход за MTok) | $3/$15 | $3/$15 | $3/$15 |
Чем отличаются Claude Opus 4 с Claude Sonnet 4
Opus 4 является «самой интеллектуальной» и «самой производительной» моделью для «передовых» задач, требующих пиковой производительности и глубокого логического вывода. Sonnet 4 сочетает «высокий интеллект» и «производительность» с «эффективностью» и «оптимизацией затрат», что делает его идеальным для «большинства производственных приложений» и «крупномасштабных сценариев использования».
Характеристика | Claude Opus 4 | Claude Sonnet 4 |
Основной фокус | Максимальный интеллект и производительность | Сбалансированный высокий интеллект и производительность/эффективность |
Идеальные сценарии использования | Сложные агентные задачи, передовое кодирование, глубокие исследования | Производственные приложения, поддержка клиентов, повседневная разработка |
Макс. выходных токенов | 32 000 | 64 000 |
Цена (Вход/Выход за MTok) | $15/$75 | $3/$15 |
Уровень безопасности | ASL-3 | Стандартный (не требует ASL-3) |
Сравнительная задержка | Умеренно быстрая | Быстрая |
Лидерство в ключевых бенчмарках (примеры) | Общее лидерство в SWE-bench, передовая производительность в агентном поиске | Лидерство в SWE-bench Verified (для моделей Claude 4), оптимальное соотношение цена/качество |
Кому доступны модели?
Кто может пользоваться:
Opus 4 и Sonnet 4 — доступны для платных подписок: Pro, Max, Team, Enterprise. Если у вас такая подписка, можете выбирать любую из двух моделей.
Бесплатный аккаунт — даёт доступ только к «младшей» модели Sonnet 4. Она чуть проще, но всё равно мощная.
Где найти модели:
- Amazon Bedrock (облачный сервис AWS),
- Google Vertex AI (платформа Google Cloud),
- API от Anthropic (можно встроить в свои приложения).
Цены
Opus 4 (самая продвинутая):
- Обработка данных (например, анализ текста или код): $15 за 1 млн «слов» (токенов).
- Генерация ответов (например, написание кода или текста): $75 за 1 млн «слов».
Sonnet 4 (базовая):
- Обработка: $3 за 1 млн «слов»,
- Генерация: $15 за 1 млн «слов».
Проще говоря:
- Opus 4 — как «премиум-класс»: дороже, но справляется с самыми сложными задачами (вроде проектирования архитектуры приложения).
- Sonnet 4 — как «эконом-вариант»: дешевле, подходит для повседневной работы (проверка кода, простые запросы).
Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!