DeepSeek-V4: новая модель Pro и Flash с поддержкой 1 миллиона токенов

Вышел DeepSeek-V4

DeepSeek представили новую версию своей модели V4 в двух вариантах: Pro и Flash. Обе модели теперь открыты и доступны через API с поддержкой контекстного окна в 1 миллион токенов.

— DeepSeek-V4-Pro: 1.6 триллиона параметров всего, 49 миллиардов активных. По заявлениям разработчиков конкурирует с топовыми закрытыми моделями, в знаниях о мире уступает только Gemini-3.1-Pro, а в математике, STEM и коде обходит все открытые модели.

— DeepSeek-V4-Flash: 284 миллиарда параметров всего, 13 миллиардов активных. Быстрее, дешевле, по рассуждениям близок к Pro, на простых агентных задачах работает наравне.

Главное обновление новая система внимания со сжатием токенов позволяет обрабатывать 1 млн токенов контекста с минимальными затратами вычислительных мощностей.

Благодаря этому контекст 1 миллион токенов стал стандартом по умолчанию, а не платной опцией и считается при этом гораздо дешевле по памяти и вычислениям.

Обе модели поддерживают два режима, Thinking и Non-Thinking, и интегрированы с Claude Code, OpenClaw и OpenCode. DeepSeek говорит, что уже использует их для собственной агентной разработки внутри компании.

API поддерживает как стандартные ответы, так и режим Thinking (рассуждение перед выдачей результата).

Веса

Демо

Подписывайтесь на Telegram Ринат Шакиров | Промпты для Midjourney | ChatGPT |.