DeepSeek выпустила V4 — первый крупный релиз
Китайская лаборатория DeepSeek наконец показала, над чем работала последние месяцы. Вышли сразу две новые модели — V4-Pro и V4-Flash. Обе с открытыми весами, обе поддерживают контекст в 1 миллион токенов.
Что за модели
V4-Pro — это тяжёлая артиллерия. 1,6 триллиона параметров суммарно, из которых активно используются 49 миллиардов. Такая архитектура называется MoE (mixture of experts): модель не гоняет через себя все параметры сразу, а подключает нужные «куски» в зависимости от задачи. Это делает её и мощной, и относительно экономичной по вычислениям.
V4-Flash — полегче. 284 миллиарда параметров, 13 миллиардов активных. Судя по названию, ориентирована на скорость — когда нужен быстрый ответ, а не долгое рассуждение.
Что это значит?

DeepSeek заявляют, что V4 обходит все существующие модели с открытым кодом и вплотную подбирается к лучшим закрытым — читай, к GPT-4o и Claude. Громкое заявление, но у DeepSeek есть история подкреплять слова результатами: в начале года их R1 наделала шуму именно потому, что реально оказалась конкурентоспособной.
Агентные задачи
Отдельно выделяют улучшенную работу в агентных сценариях — когда модель не просто отвечает на вопросы, а самостоятельно выполняет цепочки действий. V4 уже интегрирована в Claude Code, OpenClaw и OpenCode. То есть её можно использовать как движок в инструментах для разработчиков прямо сейчас.
Где попробовать
Модели доступны в веб-версии и приложении DeepSeek, а также через API. Веса открыты — так что технически их можно запустить и локально, если есть подходящее железо.
Контекст в миллион токенов — это примерно 700–750 тысяч слов, то есть несколько толстых романов за раз. Для работы с большими кодовыми базами или длинными документами это меняет многое. Посмотрим, подтвердят ли независимые бенчмарки заявленный уровень — обычно это занимает пару недель после релиза.