Калькуляторы токенов: как заранее посчитать стоимость запроса в OpenAI и Claude

Работаете с API ChatGPT или Claude и хотите понять, за что именно платите? Тогда вам нужен калькулятор токенов. В этой статье разбираемся, что такое токены, почему русский текст обходится дороже английского, какие онлайн-инструменты помогут посчитать количество токенов до отправки запроса, и как реально сэкономить на API.
Что такое токен
Языковые модели — GPT-4o, Claude, Gemini — не читают текст так, как читает человек. Они разбивают любой текст на маленькие кусочки — токены. Токен — это не слово и не буква, а что-то среднее: часть слова, целое короткое слово, знак препинания или пробел.
Именно за токены и берут деньги все провайдеры API. Причём считают их дважды: отдельно входные токены (ваш запрос, включая историю диалога) и выходные токены (ответ модели). Входные всегда дешевле. Выходные — дороже, иногда в 3–5 раз.
Понимать, сколько токенов в вашем тексте, нужно по двум причинам:
Контроль расходов. Если вы строите приложение на API и не считаете токены заранее, счёт в конце месяца может удивить. Каждый сэкономленный токен на масштабе тысяч запросов в день превращается в реальные деньги.
Соблюдение лимитов контекстного окна. У каждой модели есть максимум — суммарный лимит на вход плюс выход в одном запросе. Если ваш промпт с историей диалога превысит этот лимит, модель либо выдаст ошибку, либо «забудет» начало разговора.
Почему русский текст «съедает» токены быстрее
Это важный момент, который часто упускают. Для английского языка работает грубое правило: 1 токен ≈ 4 символа, или около 0,75 слова. Тысяча токенов — примерно 750 английских слов.
С русским всё иначе. Из-за того, что большинство моделей обучались преимущественно на англоязычных текстах, кириллица токенизируется менее эффективно. Один токен для русского текста — это примерно 2–3 символа. То есть тысяча токенов — это всего 350–600 русских слов, в зависимости от сложности текста.
Простой пример: английское HELLO — это 1 токен. Русское «ПРИВЕТ» — уже 2 токена. Длинные русские слова с приставками и суффиксами дробятся ещё сильнее. Слово «интернационализация» может разбиваться на 4–5 отдельных токенов.
Практический вывод: если вы работаете с русскоязычным контентом, закладывайте в расчёты бюджет в 2–3 раза выше, чем если бы тот же объём информации был на английском.
Хорошая новость: более новые токенизаторы частично решают эту проблему. GPT-4o и o1 используют токенизатор o200k_base, который значительно эффективнее обрабатывает кириллицу, чем старый cl100k_base, использовавшийся в GPT-3.5 и GPT-4.
Как работают токенизаторы: OpenAI vs Claude
У OpenAI и Anthropic разные алгоритмы токенизации, и один и тот же текст в них даст разные результаты.
OpenAI использует собственный инструмент tiktoken на основе алгоритма BPE (Byte Pair Encoding). Для моделей серии GPT-4 и GPT-4o — это кодировки cl100k_base и o200k_base соответственно. Tiktoken — открытая библиотека, её можно поставить через pip и считать токены локально без обращения к API.
Claude (Anthropic) использует собственный BPE-токенизатор. Локально его не запустишь — Anthropic предоставляет официальный API-метод countTokens, который бесплатно возвращает точное количество токенов до отправки основного запроса. Это самый точный способ узнать стоимость запроса к Claude заранее.
Важный нюанс: из-за разных словарей одно и то же русское слово может быть 1 токеном в Claude и 3 токенами в GPT-4. Особенно заметна разница на сложных терминах, смешанном контенте (код + текст) и специализированной лексике.
Сколько стоят токены: актуальные цены
Цены за токены указаны в долларах за 1 миллион токенов (MTok). Данные актуальны на май 2026 года.
OpenAI
| Модель | Входные токены | Выходные токены |
| GPT-5.4 | $2,50 / MTok | $15,00 / MTok |
| GPT-5-mini | $0,25 / MTok | $2,00 / MTok |
| GPT-4o | $2,50 / MTok | $10,00 / MTok |
| GPT-4o mini | $0,15 / MTok | $0,60 / MTok |
Для GPT-5.4 через Batch API (асинхронные задачи) действует скидка 50%: вход обходится в $1,25/MTok, выход — $7,50/MTok. Если задача не требует мгновенного ответа, Batch API — один из самых простых способов сократить расходы вдвое.
Кэшированные токены стоят ещё дешевле: для GPT-5.4 повторно обработанный кэшированный ввод — $0,25/MTok, то есть скидка 90%.
Claude (Anthropic)
| Модель | Входные токены | Выходные токены |
| Claude Opus 4.6 | $5,00 / MTok | $25,00 / MTok |
| Claude Sonnet 4.6 | $3,00 / MTok | $15,00 / MTok |
| Claude Haiku 4.5 | ~$0,80 / MTok | ~$4,00 / MTok |
Важное обновление: Claude Opus 4.6 и Sonnet 4.6 теперь включают полное контекстное окно в 1 миллион токенов по стандартным ценам без наценок за длинный контекст. Запрос на 900 000 токенов стоит столько же за токен, что и запрос на 9 000 токенов.
Anthropic также поддерживает Batch API со скидкой 50% для асинхронных задач и кэширование промптов — это особенно выгодно, если у вас длинный системный промпт, который повторяется в каждом запросе.
Лучшие онлайн-калькуляторы токенов
Все инструменты ниже бесплатны. Большинство работают прямо в браузере — ваш текст никуда не отправляется.
1. OpenAI Tokenizer

Ссылка: Tokenizer
Официальный инструмент от OpenAI. Вставляете текст — видите, как именно он разбивается на токены с подсветкой каждого. Незаменим, если хотите разобраться, почему конкретная фраза «весит» столько токенов. Поддерживает выбор между кодировками cl100k_base и o200k_base.
Подходит для: понимания токенизации, отладки промптов, работы с GPT-моделями.
2. Token-calculator

Ссылка: token-calculator.net
Универсальный калькулятор с поддержкой OpenAI, Claude и Gemini. Использует официальные токенизаторы для точности около 99%. Сразу показывает сравнительную таблицу стоимости по всем моделям — удобно, если выбираете, какую модель использовать под конкретную задачу.
Подходит для: сравнения стоимости между провайдерами, быстрой оценки перед разработкой.
3. Zalt

Ссылка: zalt.me/tools/tokens-counter
Работает на gpt-tokenizer — TypeScript-порте tiktoken. Показывает точное количество токенов для всех актуальных моделей OpenAI (GPT-4o, GPT-4.1, o1, o3, o4-mini, GPT-5), а также приближённые значения для Claude и Gemini. Весь расчёт происходит в браузере. Бесплатно, без регистрации.
Подходит для: разработчиков, которым нужна точность для GPT-моделей.
4. Runcell

Ссылка: runcell.dev/tool/token-counter
Поддерживает 20+ моделей, включая GPT-5, Claude 4, Gemini 3. Официальные токенизаторы — tiktoken для OpenAI, Claude-токенизатор для Anthropic. Всё считается локально в браузере.
Подходит для: тех, кто работает с несколькими провайдерами одновременно.
5. Hostbor

Ссылка: hostbor.com/llm-token-cost-calculator
Отдельная фишка — встроенная таблица бенчмарков моделей рядом с ценами. Можно сразу сопоставить стоимость и качество: например, если Claude Haiku справляется с вашей задачей так же хорошо, как Sonnet, вы переплачиваете.
Подходит для: оптимизации выбора модели с учётом бюджета.
6. Vladkas

Ссылка: vladkas
Русскоязычный калькулятор с понятным интерфейсом. Считает токены для GPT-4, GPT-4o и o1, показывает визуализацию разбивки текста. Учитывает разницу между токенизаторами cl100k_base и o200k_base.
Подходит для: русскоязычных пользователей, которые работают с OpenAI API.
7. Aitunnel

Ссылка: aitunnel.ru/pricing/kalkulyator-gpt-api
Калькулятор от российского провайдера AITUNNEL. Считает стоимость в рублях, без комиссии за конвертацию. Курс обновляется ежедневно. Удобен для тех, кто работает через российские шлюзы доступа к API.
Подходит для: оплаты в рублях, работы через российские сервисы-посредники.
Как считать токены через код
Если вы разработчик и хотите считать токены в своём приложении, а не вручную через браузер — вот основные способы.
Для OpenAI — библиотека tiktoken
import tiktoken
# Для GPT-4o и новых моделей
enc = tiktoken.get_encoding(«o200k_base»)
tokens = enc.encode(«Ваш текст здесь»)
print(f»Количество токенов: {len(tokens)}»)
# Для GPT-4, GPT-3.5
enc = tiktoken.get_encoding(«cl100k_base»)
tokens = enc.encode(«Ваш текст здесь»)
print(f»Количество токенов: {len(tokens)}»)
Tiktoken работает полностью локально, без обращения к серверам OpenAI. Это значит, что вы можете считать токены в любом количестве без ограничений и совершенно бесплатно.
Для Claude — официальный API метода countTokens
import anthropic
client = anthropic.Anthropic()
response = client.messages.count_tokens(
model=»claude-sonnet-4-6″,
messages=[{«role»: «user», «content»: «Ваш текст здесь»}]
)
print(f»Количество токенов: {response.input_tokens}»)
Этот метод бесплатен, но требует API-ключа и обращается к серверам Anthropic. Зато даёт абсолютно точный результат — именно столько токенов будет выставлено в счёт.
Как сэкономить на токенах?
Посчитать токены — это полдела. Важнее научиться их экономить.
Используйте Batch API. OpenAI и Anthropic предлагают скидку до 50% на пакетные (асинхронные) запросы. Если задача не требует мгновенного ответа — ночная обработка данных, массовая генерация контента, анализ больших объёмов текста — Batch API сокращает расходы вдвое автоматически.
Включите кэширование промптов. Если у вас длинный системный промпт — инструкции, примеры, база знаний — который повторяется в каждом запросе, настройте prompt caching. Повторно обработанные кэшированные токены стоят на 80–90% дешевле обычных.
Маршрутизируйте запросы по сложности. Простые задачи — классификация, форматирование, краткие ответы — направляйте на дешёвые модели: GPT-4o mini ($0,15/MTok входных) или Claude Haiku. Сложные задачи с рассуждением — на более мощные. Это самый недооценённый способ оптимизации бюджета.
Следите за форматированием. Markdown-разметка (заголовки, списки, таблицы) добавляет токены. HTML ещё дороже из-за длинных тегов. Эмодзи кодируются в UTF-8 и могут стоить 2–4 токена каждое — столько же, сколько целое предложение. Если ответ в JSON не нужен — не просите его.
Пишите промпты на английском, если язык ответа не критичен. Английский токенизируется примерно в 2–3 раза эффективнее русского. Для задач, где пользователь не видит промпт — системные инструкции, внутренние инструкции агента — это даёт ощутимую экономию.
Ограничивайте максимальный размер вывода. Параметр max_tokens в запросе — ваш страховочный лимит. Без него модель может генерировать длинные ответы там, где достаточно короткого. Особенно важно при работе с агентами, которые могут «думать вслух» на большое количество токенов.
Настройте мониторинг расходов. В личном кабинете OpenAI и Anthropic можно настроить уведомления при превышении бюджета. Не ждите конца месяца — выставляйте лимиты заранее.
Что нужно знать про контекстное окно
Контекстное окно — это максимальное количество токенов, которые модель может обработать в одном запросе. В него входит всё: системный промпт, история диалога, ваш новый вопрос и ответ модели.
Актуальные значения для основных моделей:
— GPT-4o и GPT-4.1 — до 128 000 токенов — GPT-4o mini — до 128 000 токенов — Claude Opus 4.6 и Sonnet 4.6 — до 1 000 000 токенов — Claude Haiku 4.5 — до 200 000 токенов
Миллион токенов — это примерно 10 средних книг или полная кодовая база крупного проекта, загруженная в один запрос. На практике такой объём нужен редко, но само наличие этого лимита снимает головную боль при работе с большими документами.
Если контекст близится к лимиту, модель начинает «забывать» начало разговора или выдаёт ошибку. Калькулятор токенов помогает отслеживать, сколько вы уже израсходовали и сколько осталось.