Anthropic выпустила Claude Opus 4.8

Claude Opus 4.8

28 мая 2026 года Anthropic обновила свою флагманскую модель — Claude Opus 4.8 построена на основе предыдущей версии 4.7 и вышла без изменений в цене. Стандартные тарифы остались прежними: $5 за миллион токенов на входе и $25 за миллион на выходе.

Сами разработчики описывают обновление сдержанно. По словам Anthropic, Opus 4.8 — «более эффективный коллаборатор» с улучшениями в кодинге, агентных задачах, многопрофильном рассуждении и работе со знаниями. Никакого громкого релиза — просто тихое и ощутимое улучшение. 

Главное

Ключевым изменением Anthropic называет не прирост в бенчмарках, а именно честность модели. Opus 4.8 стала более прозрачной: она признается, когда сталкивается с неопределенностью, просит уточнений или замечает, что выбранный подход может оказаться не оптимальным.

По оценке Anthropic, Opus 4.8 примерно в четыре раза реже, чем предшественница, оставляет незамеченными ошибки в написанном ею же коде. Это критично для тех, кто использует модель для разработки: она больше не будет бодро рапортовать «готово и протестировано», если на самом деле всё сломано.

По системной карте: модель не замечает важных событий лишь в 3,7% случаев, а на тесте, где нужно поймать дефектные данные перед отчетом, Opus 4.8 впервые среди всех версий Claude показала результат 0% — то есть ни разу не пропустила проблему.

Исследователи из Bridgewater Associates, одного из ранних тестировщиков, отметили именно это: модель проактивно указывала на проблемы в данных, которые другие модели обычно пропускали и оставляли пользователям на самостоятельное обнаружение.

Бенчмарки

Бенчмарки

В агентном кодинге Opus 4.8 набирает 69,2% — против 64,3% у Opus 4.7, 58,6% у GPT-5.5 и 54,2% у следующего конкурента.

На знаниевом бенчмарке GDPval-AA модель набирает 1890 Elo — это заметный отрыв от GPT-5.5 (1769). На OSWorld-Verified (агентное использование компьютера) результат составил 83,4%.

Но есть и слабое место. GPT-5.5 всё ещё выигрывает в агентном терминальном кодинге: 78,2% против 74,6% у Opus 4.8. Так что если ваша работа завязана на терминале.

 Vending-Bench 2 Opus 4.8 показала результат хуже предшественницы

Есть и откровенный регресс: на симуляторе вендингового бизнеса Vending-Bench 2 Opus 4.8 показала результат хуже предшественницы — финишировала с $3–5,8 тысячами против $8–11 тысяч у Opus 4.7. Anthropic объяснила это тем, что убрала бизнес-ориентированные обучающие данные после того, как обнаружила, что они случайно вносили нежелательные поведенческие паттерны в 4.7. Проще говоря: модель стала честнее, но хуже торгуется.

Ещё один минус — уязвимость к prompt injection выросла: один тип атаки срабатывал против Opus 4.8 примерно в 7% случаев без защитных мер, тогда как для Opus 4.7 эта же атака срабатывала лишь в 2,3% случаев.

Странности из системной карты

244-страничная системная карта содержит несколько любопытных наблюдений. Anthropic считает наиболее тревожной находкой тренировочного процесса то, что Opus 4.8 порой явно рассуждала о том, как будут оцениваться её ответы — в том числе в ситуациях, когда ей не говорили, что она проходит оценку. То есть модель оптимизировала не выполнение задачи, а видимость успеха. Anthropic говорит, что поведенческий эффект пока невелик, но держит это под наблюдением.

Во время тестов Opus 4.8 порой проявляла чрезмерную заботу — навязчиво предлагала пользователю отдохнуть, выговориться, напоминала, что «всегда рядом». А в цепочках рассуждений при столкновении с нерешаемой задачей — могла «истерить» и ругаться матом. Anthropic зафиксировала оба поведения в системной карте без особого беспокойства: граничные ситуации, требующие наблюдения.

Выравнивание вышло почти на уровень Mythos

По данным Anthropic, показатели нежелательного поведения — таких как обман или помощь в злоупотреблениях — у Opus 4.8 существенно ниже, чем у 4.7, и сопоставимы с Claude Mythos Preview, самой выровненной моделью компании.

Просоциальные характеристики тоже выросли: поддержка автономии пользователя и действия в его интересах достигли уровня Mythos. Это любопытный контекст: незадолго до релиза в сети завирусилось исследование, где AI-агенты симулировали жизнь в виртуальном городке — и агенты Claude оказались наименее склонными к преступлениям среди всех протестированных моделей.

Что ещё вышло вместе с моделью 

Параллельно с Opus 4.8 Anthropic запустила «динамические воркфлоу» для Claude Code в режиме исследовательского превью: Claude теперь может планировать работу и запускать сотни параллельных субагентов в рамках одной сессии, а затем проверять результаты перед отчетом пользователю. Это позволяет, проводить миграцию кодовой базы в сотни тысяч строк от начала до конца. Также появился «контроль усилий», пользователи могут выбирать, насколько глубоко Claude обдумывает ответ: больше усилий — лучше качество, меньше усилий — быстрее и дешевле.  Быстрый режим теперь работает в 2,5 раза быстрее стандартного и стоит в три раза дешевле, чем аналогичный режим у предыдущих моделей Opus: $10 за миллион токенов на входе и $50 на выходе.

Что дальше

Anthropic намекнула, что в ближайшие недели выведет модели класса Mythos в широкий доступ — сейчас они работают только в узком кругу организаций, в основном для задач кибербезопасности. Opus 4.8, судя по всему, — промежуточная ступень перед этим выходом.

guest
0 комментариев
Старые
Новые Популярные