OpenAI заявляет, что ее модели помогли обучить модель DeepSeek
Создатель ChatGPT сообщает о наличии свидетельств, и не одном. Если это так, то это многое объясняет.
🔥 Еще больше интересного в моем канале Продуктовые штучки
OpenAI и Microsoft расследуют, использовал ли DeepSeek модели OpenAI. Источники Bloomberg сообщили, что исследователи Microsoft обнаружили, что в конце 2024 года большие объемы данных были украдены через учетные записи разработчиков OpenAI, которые, возможно, связаны с DeepSeek.
В свою очередь OpenAI сообщила Financial Times, что они нашли доказательства, что DeepSeek использовала дистилляцию — технику для обучения моделей ИИ, направленную на извлечение данных из более крупных и эффективных (то есть, из данных OpenAI).
Пока OpenAI не предоставила подробностей о найденных доказательствах.
Почему это так важно?
Если это правда, то найден ответ, каким образом сопоставимая по качеству китайская ИИ модель могла стоить так дешево и появиться так быстро.
Использование дистилляции – эффективный способ быстрого обучения моделей за меньшие деньги (по оценкам, разработка DeepSeek обошлась чуть ли не в 20 раз дешевле, чем ChatGPT), о чем гадают и спорят в последние дни.
В целом это не гром среди ясного неба: эксперты уже уверено заявили, что в модель DeepSeek использовались наработки конкурентов (открытых ИИ моделей), и вопрос был только в другой возможности – использовании тренировочных данных. Теперь и по этому пункту появились сведения.
Посмотрим, успокоит ли это заявление рынок США: технологический и инвестиционный.
Какая реакция?
Д. Сакс, представитель Трампа по ИИ, уже заявил, что не удивлен, и что нужно принять меры для защиты интеллектуальной собственности. И подчеркнул, что компаниям «по мере продвижения вперед критически важно тесно сотрудничать с правительством США, чтобы наилучшим образом защитить самые эффективные модели от попыток противников и конкурентов завладеть американскими технологиями».