Миф о «дешевом» обучении DeepSeek разоблачен

Если помните, зимой компания повергла в шок своими заявлениями о стоимости моделей не только техно-, но и инвестиционный мир, произошел крупнейший обвал рынка акций. SemiAnalysis провел анализ реальных затрат, и опровергает миф, что обучение и эксплуатация ИИ моделей у DeepSeek обходятся в «считанные миллионы долларов».

🔥 Еще больше интересного в моем канале Продуктовые штучки

SemiAnalysis — независимая исследовательская компания, специализирующаяся на анализе полупроводниковой и ИИ-индустрии. Основана в 2020 году. Среди клиентов — крупнейшие мировые компании в области ИИ, облачных вычислений, полупроводников, а также венчурные фонды и государственные агентства. Публикации SemiAnalysis регулярно цитируются в ведущих СМИ и используются для принятия стратегических решений в индустрии

В январе 2025 года заявления китайской компании DeepSeek о крайне низкой стоимости обучения их ИИ-моделей (менее $6 млн против сотен миллионов у западных конкурентов) вызвали настоящий шок на мировых финансовых рынках.

После публикации DeepSeek о стоимости обучения их модели R1 акции крупнейших производителей чипов и ИИ-компаний резко обвалились:

Nvidia потеряла почти 17% за день, что эквивалентно снижению рыночной капитализации примерно на $600 млрд — крупнейшее однодневное падение в истории компании
AMD снизилась на 6,4%, Alphabet (Google) — на 4,2%, ASML — на 12%, Siemens Energy — на 22%
Индекс NASDAQ просел более чем на 3%, а совокупные потери технологического сектора США составили около $1 трлн рыночной стоимости

Причины паники? Инвесторы усомнились в необходимости миллиардных вложений в инфраструктуру и чипы для ИИ, если китайский стартап смог добиться сопоставимых результатов за считанные миллионы и на менее мощных чипах.

Это поставило под сомнение бизнес-модель производителей чипов и крупных облачных провайдеров, а также перспективы окупаемости их инвестиций

SemiAnalysis провела детальный разбор и показала, что $6 млн — это лишь малая часть реальных затрат.

Реальные инвестиции DeepSeek в ИИ — более $1,3 млрд

Она не учитывает:

1) $6 млн — только GPU-расходы на один прогон.

Прогон – это один полный цикл обучения модели на всём датасете с заданными параметрами, а таких нужно бесконечное количество

Эта сумма отражает стоимость аренды или использования GPU для одного основного этапа обучения (pre-training).

Многократные тестовые запуски и эксперименты с архитектурой. Расходы на разработку новых методов (например, Multi-Head Latent Attention).
Затраты на сбор, очистку и подготовку данных.
Операционные расходы (электричество, охлаждение, обслуживание дата-центров).
Зарплаты исследователей, инженеров и вспомогательного персонала. Инвестиции в инфраструктуру и оборудование, которые используются для множества проектов и итераций.

2) Реальные инвестиции — более $1,3 млрд.

По оценке SemiAnalysis, совокупные вложения DeepSeek в инфраструктуру, оборудование и разработку составляют порядка $1,3–1,6 млрд.
Источник

В эту сумму входят:

Покупка и эксплуатация десятков тысяч GPU (в том числе H100, H800, H20).
Капитальные затраты на собственные дата-центры.
Высокие зарплаты топ-специалистов (до $1,3 млн в год).
Многомесячные исследования и тестирование новых архитектур.
Постоянное совершенствование моделей и генерация синтетических данных для обучения.

Затраты DeepSeek на инфраструктуру. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fsemianalysis.com%2F2025%2F01%2F31%2Fdeepseek-debates%2F%23deepseek%25E2%2580%2599s-cost-and-performance&postId=2083279" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

3) Стоимость человеческого капитала

Разработка новых архитектур, тестирование, сбор и обработка данных — всё это требует команд высокооплачиваемых специалистов и месяцев работы.

4) Постоянные расходы

Обучение ИИ — это не разовая операция, а непрерывный процесс с множеством итераций, доработок и оптимизаций

Для сопоставления SemiAnalysis приводит пример Anthropic Claude 3.5 Sonnet — его обучение стоило десятки миллионов долларов только на этапе pre-training, а общие инвестиции компании составляют миллиарды (иначе не было бы необходимости привлекать такие суммы от Google и Amazon)

Таким образом, SemiAnalysis доказывает, что реальная стоимость создания и эксплуатации современных ИИ-моделей на порядки выше, чем заявляют отдельные компании.

Миф о «дешёвом» обучении возникает из-за некорректного представления о структуре расходов и игнорирования большинства ключевых статей затрат.
Источник

#искусственныйинтеллект #нейросети #инновации #deepseek #semianalysis #искусственныйинтеллект #ai #технологии #рынок #акции #инвестиции #облачныевычисления #gpu #nvidia #анализ #финансы #новостиai

Наташа Хазеева

07.02.2025

Исследователи обучили конкурента OpenAI за полчаса и менее чем за $50

На прошлой неделе DeepSeek поверг в шок технологический и финансовый рынок США, заявив, что смог создать свою модель в 20 раз дешевле, чем у OpenAI. А тут – даже не за $6 000, а $50! И не китайцы (голь на выдумку хитра), а американцы! О чем речь и почему это так важно?

Миф о «дешевом» обучении DeepSeek разоблачен

Предыстория

Как SemiAnalysis опровергла этот миф?

А что в сравнении с западными лабораториями?

Пожалуйста, поддержите меня, поставьте лайк! 🙏