Nvidia показала GPU для моделей со сверхдлинным контекстом
Компания представила Rubin CPX — графический процессор, оптимизированный под задачи с контекстом более 1 миллиона токенов.
Чип рассчитан на «disaggregated inference» — подход, где разные GPU обрабатывают разные части задачи. Это должно повысить эффективность работы моделей при генерации видео, программировании и других сценариях с длинным контекстом.
Rubin CPX выйдет в конце 2026 года.
Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.
Начать дискуссию