DeepSeek заявила, что обучение «рассуждающей» модели R1 стоило $294 тысячи

По словам гендиректора OpenAI Сэма Альтмана, компания потратила на обучение своих моделей «намного больше» $100 млн.

  • Китайская DeepSeek поделилась собственной оценкой затрат на обучение модели R1, вышедшей в январе 2025 года. По словам компании, в процессе обучения использовали 512 чипов Nvidia H800, суммарно потратив $294 тысячи.
  • Информацию об этом опубликовали в статье в академическом журнале Nature. При этом в прошлым публикациях компании информация о затратах на обучение отсутствовала, отмечает Reuters.
  • Названная DeepSeek сумма «значительно меньше», чем у американских конкурентов, подчёркивает издание. Например, гендиректор OpenAI Сэм Альтман в 2023 году заявлял, что обучение моделей компании стоило «намного больше» $100 млн.
  • Некоторые американские компании и официальные лица уже ставили под сомнения заявления DeepSeek о расходах на обучение моделей, считая их заниженными.
  • Представители нескольких «ведущих» разработчиков ИИ в разговоре с Reuters отмечали, что китайская компания учитывает только затраты на финальном этапе обучения, а реальная стоимость может быть «на порядки выше».
  • В августе 2025 года Financial Times писало, что выпуск модели DeepSeek-R2 откладывается из-за «постоянных технических проблем» с чипами Ascend от Huawei.
8
4
1
1
31 комментарий