Лимиты Claude Code: как не тратить токены впустую

Лимиты Claude Code

Если вы работаете с Claude Code и к обеду замечаете, что лимит кончился — вы не одиноки. На форумах и в Telegram-каналах разработчиков это давно стало отдельной темой для обсуждения. Один пользователь написал: «4 часа использования сгорели в 3 промпта. Использовал Plan Mode для рефакторинга архитектуры фронтенда». Другой: «Переключился на Opus 4.5 — и текущая сессия начала гореть так быстро, как никогда раньше».
Давайте разберёмся, почему так происходит, как устроены claude code лимиты на самом деле и что с этим можно сделать.

Откуда берутся лимиты и почему они вообще существуют

Anthropic ввела ограничения не ради ограничений. Когда Claude Code начал набирать популярность, небольшое число пользователей стало потреблять ресурсы в масштабах, несовместимых с нормальной работой сервиса для всех остальных. В ответ компания выстроила многоуровневую систему контроля нагрузки.
Лимиты преследуют конкретные цели: не дать одному пользователю занять непропорциональную долю GPU-мощностей, предотвратить злоупотребления вроде шаринга аккаунтов или автоматических скриптов, которые гоняют запросы круглосуточно. Без этого сервис либо деградировал бы для всех, либо подорожал бы в разы.

Как устроена система лимитов

Claude Code лимиты работают на двух уровнях одновременно.
Скользящее окно в 5 часов

Как только вы запускаете первый промпт, начинается отсчёт 5-часового окна. Всё, что вы потратите за это время, идёт из вашего пула. Сброс происходит за часы — то есть время перезапускается с момента вашего первого сообщения после того, как окно истекло.
В зависимости от плана объём токенов на одно окно существенно различается: пользователи Pro получают примерно 44 000 токенов, Max5 — около 88 000, а Max20 — порядка 220 000.
Это означает от 10 до 40 промптов на окно для Pro и от 50 до 800 промптов для Max-планов — в зависимости от сложности задач, размера кодовой базы и выбранной модели.

Недельный лимит

С августа 2025 года Anthropic добавила недельные лимиты поверх 5-часовых окон — прямая реакция на случаи, когда небольшое число пользователей потребляло ресурсы в неприемлемых объёмах.
Anthropic считает «активным часом» не астрономическое время, а периоды, когда модель реально обрабатывает токены или выполняет вычисления. Простой — пока вы листаете файлы или пьёте кофе — в лимит не идёт.

Тарифы: сколько стоит и что даёт

Сейчас действуют три основных уровня для работы через claude.ai: Pro за $20/месяц, Max5 за $100/месяц и Max20 за $200/месяц.
Важный момент: использование через claude.ai, Claude Code и Claude Desktop считается из одного общего пула. Нет отдельных лимитов для каждого интерфейса — всё идёт в одну корзину.
Для тех, кто работает через API напрямую, механика другая. API-ключ означает оплату по факту потребления — токен за токен, без жёсткого потолка. Текущие расходы сессии можно посмотреть командой /cost.
Пользователи Max-плана могут докупать использование сверх лимита по стандартным API-ценам, если исчерпали квоту.

Почему Claude Code жжёт токены быстрее, чем обычный чат

Это ключевое, что нужно понять. Claude Code — не просто чат-бот с доступом к файлам.
Каждый запрос в Claude Code — это многоходовой разговор, который включает системный промпт, накопленную историю диалога, содержимое файлов, загруженных в контекст, и токены инструментов, которые генерируются при чтении файлов, выполнении bash-команд и поиске по кодовой базе.
Самое неприятное: разработчик, который отправляет 15 итеративных команд, к последней из них может обнаружить, что один запрос тянет за собой 200 000+ токенов — просто потому что вся история диалога переносится в каждый новый запрос.
Один пользовательский запрос в Claude Code может генерировать от 8 до 12 API-вызовов — например, цикл «проверь линтером, исправь, запусти тесты, исправь снова». Каждый из них считается.

Выбор модели: где реально можно сэкономить

Выбор модели влияет существенно. Opus 4 примерно в 1,7 раза дороже Sonnet по ценам на токены, и Anthropic даёт ему значительно более жёсткие недельные лимиты по активным часам.
Официальная документация Anthropic даёт простое руководство:
Sonnet — выбор по умолчанию для большинства задач: быстрый, способный и экономичный. Opus подходит для сложных случаев — масштабных рефакторингов, трудной отладки, архитектурных решений, — но расходует лимиты заметно интенсивнее. Haiku — самый быстрый и дешевый вариант для простых запросов, правок и автоматизированных скриптов.
Переключаться между моделями можно прямо в середине сессии командой /model — история разговора при этом сохраняется. Популярный паттерн: спланировать задачу с Opus, а выполнять с Sonnet.

Пять привычек, которые реально экономят лимит

Официальная документация Anthropic выделяет пять основных причин, по которым лимит заканчивается раньше обеда.
1. Чистить контекст между задачами
Каждое предыдущее сообщение переотправляется при каждом новом запросе. Сессия, которая перешла через три разные задачи, платит за все три на каждом новом сообщении. Закончили отлаживать редирект — переходите к миграции базы данных? Сначала /clear. Файлы проекта и CLAUDE.md никуда не денутся, уйдёт только история чата.
2. Подбирать модель под задачу
Тратить Opus на рутинную работу — самый быстрый способ опустошить дневной лимит. Логика простая: Sonnet для обычной разработки, Opus когда действительно застряли или задача масштабная, Haiku для механических операций.
3. Указывать путь к файлу вместо вставки содержимого
Всё, что вы вставляете напрямую, остаётся в контексте целиком на всю сессию. Ссылка на файл позволяет Claude читать избирательно, фокусируясь на нужной части. Вместо того чтобы вставить весь auth.ts, напишите «посмотри на функцию validateToken в src/auth.ts».
4. Держать CLAUDE.md компактным
Этот файл добавляется к каждому запросу. Благодаря кешированию промптов повторные обращения обходятся дешевле, но файл всё равно занимает место в контекстном окне при каждом сообщении. Официальный совет — не больше 200 строк, и только то, что реально нужно.
5. Просить план перед большими изменениями
Планирование стоит несколько сотен токенов. Неправильный diff на 400 строк, который вы откатываете и генерируете заново, стоит тысячи — дважды, плюс все токены на объяснение, что пошло не так.

Команды, которые помогают экономить

Несколько команд помогают держать ситуацию под контролем: /clear — полная очистка истории диалога (проектная память остаётся), /compact — сжатие истории с сохранением контекста для продолжения задачи, /model — просмотр и смена модели, /cost — текущие расходы сессии в токенах и деньгах.
Ещё один лайфхак из практики разработчиков: спланируйте первый промпт так, чтобы 5-часовое окно накрывало ваш пиковый рабочий блок — тогда к концу дня у вас останется запас, а не застывший таймер.

Как добавить лимиты?

Пользователям Enterprise-аккаунтов система сама сообщает, когда сбросится окно. Можно переключиться на более лёгкую модель или временно перейти на API-ключ, если организация это разрешает. Пользователям API жёсткого потолка нет — но стоит проверить расходы через /cost, если цифры кажутся неожиданными: почти всегда причина в длинных сессиях, которые ни разу не очищали.

Итог

Claude Code лимиты — это не произвол, а попытка сохранить работоспособность сервиса для всех. Разобравшись в механике, можно перестать жечь токены впустую и работать заметно продуктивнее в рамках одного и того же плана.
Главное, что нужно помнить: контекст накапливается и стоит денег, модели различаются по цене в несколько раз, а /clear в начале каждой новой задачи — это не просто команда, а привычка, которая продлевает рабочий день.

guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии