DeepSeek заявила, что обучение «рассуждающей» модели R1 стоило $294 тысячи
По словам гендиректора OpenAI Сэма Альтмана, компания потратила на обучение своих моделей «намного больше» $100 млн.
- Китайская DeepSeek поделилась собственной оценкой затрат на обучение модели R1, вышедшей в январе 2025 года. По словам компании, в процессе обучения использовали 512 чипов Nvidia H800, суммарно потратив $294 тысячи.
- Информацию об этом опубликовали в статье в академическом журнале Nature. При этом в прошлым публикациях компании информация о затратах на обучение отсутствовала, отмечает Reuters.
- Названная DeepSeek сумма «значительно меньше», чем у американских конкурентов, подчёркивает издание. Например, гендиректор OpenAI Сэм Альтман в 2023 году заявлял, что обучение моделей компании стоило «намного больше» $100 млн.
- Некоторые американские компании и официальные лица уже ставили под сомнения заявления DeepSeek о расходах на обучение моделей, считая их заниженными.
- Представители нескольких «ведущих» разработчиков ИИ в разговоре с Reuters отмечали, что китайская компания учитывает только затраты на финальном этапе обучения, а реальная стоимость может быть «на порядки выше».
- В августе 2025 года Financial Times писало, что выпуск модели DeepSeek-R2 откладывается из-за «постоянных технических проблем» с чипами Ascend от Huawei.
31 комментарий