Anthropic представляет Claude Sonnet 4.5: ИИ, который работает над вашим кодом 30 часов подряд
Anthropic анонсировала новую модель, Claude Sonnet 4.5, и заявляет, что она теперь лидер в программировании. Что по-настоящему впечатляет, так это её выносливость: в тестах она работала над созданием приложения, похожего на Slack, около 30 часов без остановки, пока не закончила проект . Для сравнения, предыдущие версии могли работать автономно только около 7 часов . Это большое достижение для автоматизации сложных задач, где нужна долгая концентрация.
Что это за модель и для кого она
Claude Sonnet 4.5 — фокусируется на решении практических задач разработчиков. Эта штука может автономно работать до 30 часов подряд, не теряя концентрации . Это в четыре раза дольше, чем могли предыдущие версии. Представь, ИИ может потратить целые сутки с лишним, например, на то, чтобы написать, протестировать и довести до ума целое приложение. В Anthropic даже рассказывают, как в ходе одного такого марафона модель написала около 11 тысяч строк кода для создания рабочего прототипа мессенджера, похожего на Slack, и остановилась только когда всё было готово
Модель ориентирована на:
- Агентские сценарии — когда ИИ действует автономно, используя различные инструменты.
- Создание кода — от прототипов до готовых к использованию приложений.
- Долгие многоэтапные задачи, требующие глубокого анализа и планирования.
При этом компания сохранила для разработчиков привлекательную ценовую политику: $3 за миллион входных токенов и $15 за миллион выходных, а размер контекстного окна составляет 200 000 токенов.
Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!

Что умеет нового Claude Sonnet 4.5
1. Невероятная выносливость
В ходе внутренних тестов модель продемонстрировала, что может не просто генерировать код, а полностью вести проект. Она самостоятельно создала чат-приложение уровня Slack или Teams, написав для этого 11 000 строк кода, а также настраивала базы данных, покупала доменные имена и даже проходила аудит безопасности SOC 2. Вся работа была выполнена за один 30-часовой сеанс без вмешательства человека.
2. Лидерство в программировании
На специализированном бенчмарке SWE-bench Verified, который проверяет способность ИИ решать реальные задачи из GitHub, Sonnet 4.5 показала результат 77.2%. При увеличении вычислительных ресурсов этот показатель может достигать 82.0%. Это говорит о том, что модель действительно понимает суть проблем и может предлагать рабочие решения.
3. Лучшее управление компьютером
Способность ИИ взаимодействовать с компьютерными интерфейсами (открывать браузер, работать в терминале) значительно возросла. На тесте OSWorld модель набрала 61.4%, что является огромным шагом вперёд по сравнению с 42.2% у предыдущего поколения. Это делает её в три раза эффективнее в навигации и автоматизации рутинных действий.
4. Технологии для долгой работы
Чтобы обеспечить стабильную работу в течение многих часов, инженеры Anthropic реализовали несколько ключевых технологий:
Редактирование контекста на лету: система научилась сама очищать историю диалога от ненужных деталей, оставляя только самое важное, что экономит ресурсы.
Инструмент памяти: модель может сохранять рабочие заметки и состояние задачи за пределами окна диалога, чтобы не забывать о главной цели.
Важное обновление для разработчиков: Claude Code
Вместе с новой моделью был серьёзно улучшен и специализированный сервис для программистов Claude Code, который теперь по умолчанию использует Sonnet 4.5.
Самая полезная новинка для тех, кто работает над сложными проектами — функция «контрольных точек» (checkpoints). Она позволяет в любой момент сохранить прогресс задачи и, если что-то пошло не так, вернуться к этой точке, отменив все последующие изменения. Это своего рода система спасения для долгих сеансов кодинга, которая избавляет от страха что-то сломать.
Где это можно применять
Anthropic выделяет несколько сфер, где их модель особенно эффективна:
- Кибербезопасность: Агенты на базе Sonnet 4.5 могут проактивно находить и патчить уязвимости до того, как ими воспользуются злоумышленники.
- Финансы: Модель справляется с задачами от базового анализа до сложного прогнозирования и автоматического адаптацией систем под изменения в регуляторике.
- Исследования: ИИ может самостоятельно проводить изыскания, анализировать данные из разных источников и синтезировать готовые отчёты и инсайты.
Что говорят тестировщики
Бета-тестеры из компаний Canva, Cursor и Windsurf уже высоко оценили новую модель. Они отмечают, что Sonnet 4.5 отлично справляется со сложными задачами с «длинным контекстом» — от внесения инженерных правок в крупную кодовую базу до продуктовых исследований. Генеральный директор Cursor Майкл Труэлл заявил, что новая модель задаёт новый стандарт производительности, особенно для долгосрочных задач.
Вывод: почему это важно
Анонс Claude Sonnet 4.5 — это не просто очередное постепенное обновление. Это качественный скачок, который меняет представление о том, как ИИ может участвовать в разработке. Способность концентрироваться на одной задаче десятки часов, самостоятельно планировать и исправлять ошибки делает эту модель уже не просто помощником, а автономным сотрудником, который может взять на себя целый пласт работы по созданию и поддержке программного обеспечения.
Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!