Китайская модель DeepSeek R1 уронила акции NVidia и наделала много шума в ИИ-мире за последнюю неделю. В чем причина?

Прошли выходные, и стало ясно, что на прошлой неделе на рынке AI была не просто очередная новость о релизе, а неплохо так жахнуло.
И нет, речь не о Stargate и их $500 млрд.
20 января китайцы из DeepSeek релизнули свою версию "думающей" модели R1, причем им удалось сделать ее почти такого же качества, как и OpenAI o1, а на некоторых тестах и лучше, см. сравнение на бенчмарках в таблице ниже. Кстати, на русском языке модель тоже очень хороша.

Да, это могла бы быть просто очень хорошая модель, вот только есть несколько важнейших нюансов.

Соотношение ресурсов DeepSeek и известных грандов AI примерно вот такое

Как этого добились - будет в конце статьи, но пока важен сам факт: внезапно оказалось, что несколькими техническими трюками (или чудесами, если угодно) можно радикально уменьшить потребности в оборудовании!

Акции NVIDIA, весь бизнес которой сейчас основан на огромных требованиях AI к серверам, ожидаемо улетели в минус - на скриншоте они получили примерно -11% на премаркете, в ходе торгов падение доходило и до -20%.

Такое ощущение, что скоро не только на TikTok наложат запрет в США :)

Приложение - топ-1 глобального AppStore и топ-1 в русском AppStore. Скачиваний и использования так много, что сообщается о локальных сбоях и ожидании ответов - впрочем, кажется, пока ничего глобального.

При желании (и наличии железа) ее можно развернуть полностью у себя, в отличие от закрытой o1. Это большой плюс, в первую очередь с точки зрения безопасности, так как код можно проверить на наличие уязвимостей, а сама модель может быть установлена и использоваться в закрытом контуре, чтобы данных компании никуда не передавались. Кроме того, доступность кода сильно продвигает всю индустрию вперед.

Китайская модель DeepSeek R1 уронила акции NVidia и наделала много шума в ИИ-мире за последнюю неделю. В чем причина?

Базово, ребята придумали сразу несколько крутых приемов (источник).

Это может прозвучать странно, но вот так сложилось, что в AI в числах используют 32 знака. DeepSeek решили использовать только 8 - и сразу получили на 75% меньше памяти.

Да, в модели 670 миллиардов параметров, но одновременно активны около 37 миллиардов - то есть он работает не как эксперт во всем, а как группа экспертов, которые переключаются по мере необходимости, но при этом каждый требует куда меньше памяти.

Есть что-то общее с AI-агентами, да :)

Приведу почти буквальный перевод источника:

Обычный ИИ читает как первоклассник: "Кошка... сидит... на...". DeepSeek читает целыми фразами сразу. В 2 раза быстрее, с точностью 90%. Когда вы обрабатываете миллиарды слов, это ВАЖНО.

Конечно, это не значит, что теперь OpenAI и другие гранды повержены - они все еще в строю, и быстро унаследуют идеи от DeepSeek. Но мы получили еще один крутой прецедент того, как талантливый стартап может внезапно взлететь на мировой арене - уверен, не последний. Скорее всего, DS станут еще одним общепризнанным мировым лидером AI: с ними уже начало проводить встречи правительство Китая, планируются инвестиции и т.п.

Изменит ли это глобально отрасль AI? Пожалуй, мы получим довольно сильное влияние на рынок оборудования и больше конкуренции в среднесрочной перспективе - безусловно, это плюс.

Telegram-канал про ИИ в бизнесе

1010

2121

разместить

1 комментарий

wolk1612

28 янв

Очень интересно и свежо, обязательно буду читать вас еще, очень жду новых постов!

Ответить

Алексей Иванов

29 янв

DeepSeek: не просто хайп, а новые правила игры

Пост в X (ранее Twitter) от имени аккаунта-пародии основателя DeepSeek<br />

Что общего между Кремниевой долиной и китайским городом Ханчжоу? До вчерашнего дня — ничего. Но когда команда DeepSeek анонсировала свою новую ИИ-модель, созданную всего за 5.5 миллионов долларов, в офисах технологических гигантов начались экстренные совещания. В своей прошлой статье я упомянул новую нейросеть DeepSeek. В этой статье расскажу подро…

2020

DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

Недавно китайцы запустили "убийцу ChatGPT" – DeepSeek. Казалось бы, что ничего необычного в этом нет – еще одна нейросеть… но это только на первый взгляд

Когда обращаться в автоломбард: как автомобиль помогает решать срочные финансовые задачи

Diana Kass

29 янв

🐋 DeepSeek: китайская нейросеть, которая только что хакнула рынок AI

Уже слышали про DeepSeek? Эта китайская нейросеть ворвалась в топ, обрушила акции IT-гигантов и показала, что нейросети можно тренировать быстрее, дешевле, без топового железа, а западные компании, возможно, просто раздували AI-пузырь.

1212

Полина Лааксо

27 янв

Требует меньше мощностей, денег и времени: почему китайская нейросеть DeepSeek заставила Кремниевую долину «встрепенуться»

Мнением поделился вице-президент по продукту и развитию ИИ-подразделения Dropbox Морган Браун.

149149

4040

Лайк. Deepseek очень крут.

1 ответ на пост

Наташа Хазеева

ChatGPT

28 янв

Какие вопросы ставит успех DeepSeek и какие сейчас есть ответы

Жаркие споры вокруг успеха DeepSeek продолжаются. Подведем некоторые промежуточные итоги

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.theverge.com%2F24353060%2Fdeepseek-ai-china-nvidia-openai&postId=1780377" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Заработок в Telegram без единой рекламы: Способы, которые реально приносят деньги

Telegram — это не только популярный мессенджер, но и мощная платформа для заработка. Многие пользователи стремятся монетизировать свои каналы, однако не все хотят или могут размещать рекламу. В этой статье мы рассмотрим несколько эффективных способов получения дохода в Telegram без использования рекламных интеграций.

Nocto

28 янв

DeepSeek vs Мировые Гиганты: Как Китайские Нейросети Встряхнули Рынок ИИ и Вызвали Реакцию Трампа, OpenAI и Nvidia

Китайская DeepSeek бросила вызов лидерам ИИ, выпустив нейросети с открытым кодом и чат-ботом-хитом App Store. Узнайте, как OpenAI, Трамп и Nvidia отреагировали на прорыв, который перевернул представление о затратах на ИИ и спровоцировал обвал акций.

AI Adepts

28 янв

DeepSeek R1: как китайский AI-штурмовик меняет представление об искусственном интеллекте

DeepSeek vs ChatGPT: почему Китай уже выиграл гонку нейросетей

В мире искусственного интеллекта сейчас много разговоров. Китайская компания DeepSeek представила свою модель R1. Многим кажется, что она может составить серьезную конкуренцию западным конкурентам, вроде OpenAI и их ChatGPT. Давайте посмотрим, что произошло и почему китайцы в этой гонке впереди.

Kliment Vikulov

28 янв

Как китайцы из DeepSeek взорвали рынок ИИ, потратив в 20 раз меньше денег чем OpenAI

1313

DeepSeek. Китайский прорыв в ИИ, который взорвал рынок и напугал OpenAI, Google и Microsoft

Вы устали платить большие деньги за ИИ-сервисы, которые не оправдывают ожиданий? Или вам надоели бесконечные подписки и скрытые платежи за «инновационные» технологии, которые на деле не так уж эффективны? В этой статье я расскажу, как китайская компания DeepSeek поменяла правила игры, предложив мощную модель ИИ за меньшую цену и без скрытых затрат.…

Китайская модель DeepSeek R1 уронила акции NVidia и наделала много шума в ИИ-мире за последнюю неделю. В чем причина?

Из-за чего тогда шум?

Модель требует в 20 (!) раз меньше железа и стоит, соответственно, в 20 раз дешевле для пользователей

Модель полностью бесплатна при использовании через UI или мобильное приложение.

Модель полностью доступна в Open Source

Как удалось всего этого достичь?

Уменьшение количества знаков в числах

Использование не всех параметров сразу

Multi-token system

Что в итоге?