Nvidia анонсировала открытые модели Nemotron 3

В семействе три модели: Nano, Super и Ultra. Отличия — в размерах и производительности. Все работают с контекстом длиной до 1 миллиона токенов.

Nano уже вышла. Это MoE-модель с 31.6 миллиардами параметров (3.2 миллиарда активных). По бенчмаркам она точнее и быстрее GPT-OSS-20B и Qwen3-30B-A3B-Thinking-2507.

Super и Ultra выйдут в ближайшие месяцы.

Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.

Начать дискуссию