Claude Opus 4.7: что изменилось и при чем здесь Mythos

Claude Opus 4.7: что изменилось

16 апреля 2026 года Anthropic выпустила Claude Opus 4.7 — обновленную версию флагманской модели, которая пришла на смену Opus 4.6, запущенному ещё в феврале этого года. Модель уже доступна на claude.ai для платных подписчиков, а также через Amazon Bedrock для разработчиков и компаний.

Цена осталась прежней: $5 за миллион входящих токенов и $25 за миллион исходящих — столько же, сколько стоил Opus 4.6.

Что нового

Opus 4.7 лучше работает в условиях неоднозначных инструкций, более тщательно подходит к решению задач и точнее следует указаниям пользователя.

Главные улучшения по направлениям:

Кодинг и агентные задачи. Opus 4.7 предназначен для выполнения длительных задач с минимальным контролем — модель проверяет собственные результаты перед тем, как отчитаться, и следует инструкциям с большей точностью. Для разработчиков добавлен новый уровень усилий xhigh, который располагается между high и max и даёт более тонкий контроль над балансом между качеством рассуждений и задержкой ответа. В бета-режиме появились «бюджеты задач» — механизм, позволяющий Claude расставлять приоритеты и управлять затратами на длинных прогонах. Также добавлена команда /ultrareview, которая запускает отдельную сессию проверки кода и ловит ошибки, которые заметил бы внимательный человек-ревьюер.

Зрение и визуальный контент. Anthropic заявляет, что Opus 4.7 видит изображения с более чем втрое большим разрешением, чем Opus 4.6. Улучшенная поддержка изображений высокого разрешения повышает точность при работе с графиками, плотными документами и экранными интерфейсами, где важны мелкие детали. Это непосредственно влияет на практические результаты: модель качественнее генерирует интерфейсы, слайды и документы в задачах, связанных с визуальным контентом.

Профессиональная работа. Opus 4.7 продвигается в сторону профессиональных задач: создание слайдов и документов, финансовый анализ, визуализация данных. 

Профессиональная работа

Бенчмарки: как Opus 4.7 выглядит на фоне конкурентов

Бенчмарки: как Opus 4.7 выглядит на фоне конкурентов

На основных тестах Opus 4.7 опережает GPT-5.4 и Gemini 3.1 Pro по большинству ключевых показателей. 

Агентный кодинг (SWE-bench Pro): Opus 4.7 набирает 64.3% — это прирост с 53.4% у Opus 4.6. GPT-5.4 показывает 57.7%, Gemini 3.1 Pro — 54.2%. 

Агентный кодинг (SWE-bench Verified): 87.6% у Opus 4.7 против 80.8% у Opus 4.6 и 80.6% у Gemini 3.1 Pro. У GPT-5.4 сопоставимого результата не приводится. 

Работа с инструментами (MCP-Atlas): Opus 4.7 лидирует с 77.3% против 75.8% у Opus 4.6, 68.1% у GPT-5.4 и 73.9% у Gemini 3.1 Pro. 

Рассуждения уровня аспирантуры (GPQA Diamond): 94.2% у Opus 4.7 — чуть ниже GPT-5.4 Pro (94.4%) и чуть выше Gemini 3.1 Pro (94.3%). По сути, тройная ничья на уровне погрешности. 

Многоязычный вопрос-ответ (MMMLU): 91.5% у Opus 4.7 против 91.1% у Opus 4.6 и 92.6% у Gemini 3.1 Pro — здесь Google незначительно впереди. 

Есть и направление, где Opus 4.7 проигрывает: GPT-5.4 опережает его на бенчмарке агентного поиска BrowseComp (89.3% против 79.3%). Впрочем, у этого теста есть вопросы к достоверности — ранее Opus 4.6 был замечен в том, что расшифровывал ключ ответа во время оценки.

Прежде чем делать выводы только по цифрам, стоит учитывать контекст. Индустрия до сих пор не имеет надёжного способа измерить реальные улучшения ИИ: OpenAI недавно признала ведущий кодинговый бенчмарк «загрязнённым», однако модели продолжают сравниваться по тем же тестам. Это означает, что разрыв в несколько процентных пунктов между моделями на практике может ощущаться совершенно иначе, чем в таблицах.

Mythos

Opus 4.7 — не самая мощная модель Anthropic. Этот титул принадлежит Claude Mythos — специализированной модели в области кибербезопасности, которую компания тихо передает избранным охранным фирмам, не выпуская в публичный доступ. 

Нераскрытый Mythos Preview набирает 77.8% на SWE-bench Pro против 64.3% у Opus 4.7 — это говорит о том, что у Anthropic есть возможности, которые она пока не поставляет широкой аудитории. 

Связь между Opus и Mythos теснее, чем кажется: Anthropic строит свои передовые модели путем дообучения на базе линейки Opus — тот же фундамент, что лежит в основе публичных продуктов Claude, проходит стресс-тестирование и превращается в Mythos. Иными словами, Opus 4.7 — это тот же Mythos, только до того, как в него вбили специализированные возможности.

Кому это важно

Восемь из десяти компаний Fortune 10 теперь являются клиентами Claude. Трафик Claude за прошедший год вырос примерно в 5 раз, компания привлекла $30 млрд при оценке в $380 млрд в феврале. 

Для обычных пользователей Opus 4.7 — это прежде всего более точное следование инструкциям, существенно лучшее распознавание изображений и заметный скачок в кодинге. Для разработчиков и корпоративных клиентов добавляются более тонкие инструменты управления агентными задачами и контроля затрат. Цена при этом не изменилась.

Конкурентная картина по-прежнему неоднозначна: GPT-5.4 берёт своё в агентном поиске и отдельных задачах автоматизации, Gemini 3.1 Pro остаётся привлекательнее по цене и лидирует в многоязычных задачах. Но на агентных и кодинговых задачах, где Claude традиционно был силён, Opus 4.7 расширяет разрыв, а не уступает позиции.

guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии