Миф о «дешевом» обучении DeepSeek разоблачен

Если помните, зимой компания повергла в шок своими заявлениями о стоимости моделей не только техно-, но и инвестиционный мир, произошел крупнейший обвал рынка акций. SemiAnalysis провел анализ реальных затрат, и опровергает миф, что обучение и эксплуатация ИИ моделей у DeepSeek обходятся в «считанные миллионы долларов».

🔥 Еще больше интересного в моем канале Продуктовые штучки

SemiAnalysis — независимая исследовательская компания, специализирующаяся на анализе полупроводниковой и ИИ-индустрии. Основана в 2020 году. Среди клиентов — крупнейшие мировые компании в области ИИ, облачных вычислений, полупроводников, а также венчурные фонды и государственные агентства. Публикации SemiAnalysis регулярно цитируются в ведущих СМИ и используются для принятия стратегических решений в индустрии

Предыстория

В январе 2025 года заявления китайской компании DeepSeek о крайне низкой стоимости обучения их ИИ-моделей (менее $6 млн против сотен миллионов у западных конкурентов) вызвали настоящий шок на мировых финансовых рынках.

После публикации DeepSeek о стоимости обучения их модели R1 акции крупнейших производителей чипов и ИИ-компаний резко обвалились:

  • Nvidia потеряла почти 17% за день, что эквивалентно снижению рыночной капитализации примерно на $600 млрд — крупнейшее однодневное падение в истории компании
  • AMD снизилась на 6,4%, Alphabet (Google) — на 4,2%, ASML — на 12%, Siemens Energy — на 22%
  • Индекс NASDAQ просел более чем на 3%, а совокупные потери технологического сектора США составили около $1 трлн рыночной стоимости

Причины паники? Инвесторы усомнились в необходимости миллиардных вложений в инфраструктуру и чипы для ИИ, если китайский стартап смог добиться сопоставимых результатов за считанные миллионы и на менее мощных чипах.

Это поставило под сомнение бизнес-модель производителей чипов и крупных облачных провайдеров, а также перспективы окупаемости их инвестиций

Как SemiAnalysis опровергла этот миф?

SemiAnalysis провела детальный разбор и показала, что $6 млн — это лишь малая часть реальных затрат.

Реальные инвестиции DeepSeek в ИИ — более $1,3 млрд

Она не учитывает:

1) $6 млн — только GPU-расходы на один прогон.

Прогон – это один полный цикл обучения модели на всём датасете с заданными параметрами, а таких нужно бесконечное количество

Эта сумма отражает стоимость аренды или использования GPU для одного основного этапа обучения (pre-training).

  • Многократные тестовые запуски и эксперименты с архитектурой. Расходы на разработку новых методов (например, Multi-Head Latent Attention).
  • Затраты на сбор, очистку и подготовку данных.
  • Операционные расходы (электричество, охлаждение, обслуживание дата-центров).
  • Зарплаты исследователей, инженеров и вспомогательного персонала. Инвестиции в инфраструктуру и оборудование, которые используются для множества проектов и итераций.

2) Реальные инвестиции — более $1,3 млрд.

По оценке SemiAnalysis, совокупные вложения DeepSeek в инфраструктуру, оборудование и разработку составляют порядка $1,3–1,6 млрд.

В эту сумму входят:

  • Покупка и эксплуатация десятков тысяч GPU (в том числе H100, H800, H20).
  • Капитальные затраты на собственные дата-центры.
  • Высокие зарплаты топ-специалистов (до $1,3 млн в год).
  • Многомесячные исследования и тестирование новых архитектур.
  • Постоянное совершенствование моделей и генерация синтетических данных для обучения.
Затраты DeepSeek на инфраструктуру. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fsemianalysis.com%2F2025%2F01%2F31%2Fdeepseek-debates%2F%23deepseek%25E2%2580%2599s-cost-and-performance&postId=2083279" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
Затраты DeepSeek на инфраструктуру. Источник

3) Стоимость человеческого капитала

Разработка новых архитектур, тестирование, сбор и обработка данных — всё это требует команд высокооплачиваемых специалистов и месяцев работы.

4) Постоянные расходы

Обучение ИИ — это не разовая операция, а непрерывный процесс с множеством итераций, доработок и оптимизаций

А что в сравнении с западными лабораториями?

Для сопоставления SemiAnalysis приводит пример Anthropic Claude 3.5 Sonnet — его обучение стоило десятки миллионов долларов только на этапе pre-training, а общие инвестиции компании составляют миллиарды (иначе не было бы необходимости привлекать такие суммы от Google и Amazon)

Таким образом, SemiAnalysis доказывает, что реальная стоимость создания и эксплуатации современных ИИ-моделей на порядки выше, чем заявляют отдельные компании.

Миф о «дешёвом» обучении возникает из-за некорректного представления о структуре расходов и игнорирования большинства ключевых статей затрат.

Пожалуйста, поддержите меня, поставьте лайк! 🙏

23
1
1
25 комментариев