DeepSeek выпустила V4 — первый крупный релиз

DeepSeek V4

Китайская лаборатория DeepSeek наконец показала, над чем работала последние месяцы. Вышли сразу две новые модели — V4-Pro и V4-Flash. Обе с открытыми весами, обе поддерживают контекст в 1 миллион токенов.

Что за модели

V4-Pro — это тяжёлая артиллерия. 1,6 триллиона параметров суммарно, из которых активно используются 49 миллиардов. Такая архитектура называется MoE (mixture of experts): модель не гоняет через себя все параметры сразу, а подключает нужные «куски» в зависимости от задачи. Это делает её и мощной, и относительно экономичной по вычислениям.

V4-Flash — полегче. 284 миллиарда параметров, 13 миллиардов активных. Судя по названию, ориентирована на скорость — когда нужен быстрый ответ, а не долгое рассуждение.

Что это значит?

DeepSeek V4 в тестах

DeepSeek заявляют, что V4 обходит все существующие модели с открытым кодом и вплотную подбирается к лучшим закрытым — читай, к GPT-4o и Claude. Громкое заявление, но у DeepSeek есть история подкреплять слова результатами: в начале года их R1 наделала шуму именно потому, что реально оказалась конкурентоспособной.

Агентные задачи

Отдельно выделяют улучшенную работу в агентных сценариях — когда модель не просто отвечает на вопросы, а самостоятельно выполняет цепочки действий. V4 уже интегрирована в Claude Code, OpenClaw и OpenCode. То есть её можно использовать как движок в инструментах для разработчиков прямо сейчас.

Где попробовать

Модели доступны в веб-версии и приложении DeepSeek, а также через API. Веса открыты — так что технически их можно запустить и локально, если есть подходящее железо.

Контекст в миллион токенов — это примерно 700–750 тысяч слов, то есть несколько толстых романов за раз. Для работы с большими кодовыми базами или длинными документами это меняет многое. Посмотрим, подтвердят ли независимые бенчмарки заявленный уровень — обычно это занимает пару недель после релиза.

guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии