Миф о «дешевом» обучении DeepSeek разоблачен
Если помните, зимой компания повергла в шок своими заявлениями о стоимости моделей не только техно-, но и инвестиционный мир, произошел крупнейший обвал рынка акций. SemiAnalysis провел анализ реальных затрат, и опровергает миф, что обучение и эксплуатация ИИ моделей у DeepSeek обходятся в «считанные миллионы долларов».
🔥 Еще больше интересного в моем канале Продуктовые штучки
SemiAnalysis — независимая исследовательская компания, специализирующаяся на анализе полупроводниковой и ИИ-индустрии. Основана в 2020 году. Среди клиентов — крупнейшие мировые компании в области ИИ, облачных вычислений, полупроводников, а также венчурные фонды и государственные агентства. Публикации SemiAnalysis регулярно цитируются в ведущих СМИ и используются для принятия стратегических решений в индустрии
Предыстория
В январе 2025 года заявления китайской компании DeepSeek о крайне низкой стоимости обучения их ИИ-моделей (менее $6 млн против сотен миллионов у западных конкурентов) вызвали настоящий шок на мировых финансовых рынках.
После публикации DeepSeek о стоимости обучения их модели R1 акции крупнейших производителей чипов и ИИ-компаний резко обвалились:
- Nvidia потеряла почти 17% за день, что эквивалентно снижению рыночной капитализации примерно на $600 млрд — крупнейшее однодневное падение в истории компании
- AMD снизилась на 6,4%, Alphabet (Google) — на 4,2%, ASML — на 12%, Siemens Energy — на 22%
- Индекс NASDAQ просел более чем на 3%, а совокупные потери технологического сектора США составили около $1 трлн рыночной стоимости
Причины паники? Инвесторы усомнились в необходимости миллиардных вложений в инфраструктуру и чипы для ИИ, если китайский стартап смог добиться сопоставимых результатов за считанные миллионы и на менее мощных чипах.
Это поставило под сомнение бизнес-модель производителей чипов и крупных облачных провайдеров, а также перспективы окупаемости их инвестиций
Как SemiAnalysis опровергла этот миф?
SemiAnalysis провела детальный разбор и показала, что $6 млн — это лишь малая часть реальных затрат.
Реальные инвестиции DeepSeek в ИИ — более $1,3 млрд
Она не учитывает:
1) $6 млн — только GPU-расходы на один прогон.
Прогон – это один полный цикл обучения модели на всём датасете с заданными параметрами, а таких нужно бесконечное количество
Эта сумма отражает стоимость аренды или использования GPU для одного основного этапа обучения (pre-training).
- Многократные тестовые запуски и эксперименты с архитектурой. Расходы на разработку новых методов (например, Multi-Head Latent Attention).
- Затраты на сбор, очистку и подготовку данных.
- Операционные расходы (электричество, охлаждение, обслуживание дата-центров).
- Зарплаты исследователей, инженеров и вспомогательного персонала. Инвестиции в инфраструктуру и оборудование, которые используются для множества проектов и итераций.
2) Реальные инвестиции — более $1,3 млрд.
По оценке SemiAnalysis, совокупные вложения DeepSeek в инфраструктуру, оборудование и разработку составляют порядка $1,3–1,6 млрд.
В эту сумму входят:
- Покупка и эксплуатация десятков тысяч GPU (в том числе H100, H800, H20).
- Капитальные затраты на собственные дата-центры.
- Высокие зарплаты топ-специалистов (до $1,3 млн в год).
- Многомесячные исследования и тестирование новых архитектур.
- Постоянное совершенствование моделей и генерация синтетических данных для обучения.
3) Стоимость человеческого капитала
Разработка новых архитектур, тестирование, сбор и обработка данных — всё это требует команд высокооплачиваемых специалистов и месяцев работы.
4) Постоянные расходы
Обучение ИИ — это не разовая операция, а непрерывный процесс с множеством итераций, доработок и оптимизаций
А что в сравнении с западными лабораториями?
Для сопоставления SemiAnalysis приводит пример Anthropic Claude 3.5 Sonnet — его обучение стоило десятки миллионов долларов только на этапе pre-training, а общие инвестиции компании составляют миллиарды (иначе не было бы необходимости привлекать такие суммы от Google и Amazon)
Таким образом, SemiAnalysis доказывает, что реальная стоимость создания и эксплуатации современных ИИ-моделей на порядки выше, чем заявляют отдельные компании.
Миф о «дешёвом» обучении возникает из-за некорректного представления о структуре расходов и игнорирования большинства ключевых статей затрат.