OpenAI представила gpt-oss — рассуждающие модели с открытыми весами

Они доступны на Hugging Face.

  • Представлено два варианта: gpt-oss-120b с 120 млрд параметров (5,1 млрд активных) и gpt-oss-20b с 20 млрд (3,6 млрд активных). Обе версии доступны по лицензии Apache 2.0 — их можно модифицировать и использовать для коммерческих целей, указывает The Verge.
  • TechCrunch отмечает, что это первые «открытые» языковые модели OpenAI со времён GPT-2, выпущенной более пяти лет назад. Есть демоверсия для разработчиков.
  • По словам компании, gpt-oss-120b почти сопоставима с моделью o4-mini в основных бенчмарках и может работать на одном графическом процессоре с объёмом памяти 80 ГБ. Версия gpt-oss-20b показывает результаты, схожие с o3-mini, и использует 16 ГБ памяти.
Сравнение точности ответов моделей OpenAI в тесте «последний экзамен человечества», созданном для оценки способностей ИИ в академических вопросах. Источник: OpenAI
Сравнение точности ответов моделей OpenAI в тесте «последний экзамен человечества», созданном для оценки способностей ИИ в академических вопросах. Источник: OpenAI
Сравнение точности ответов моделей OpenAI в «канонических бенчмарках». Источник: OpenAI
Сравнение точности ответов моделей OpenAI в «канонических бенчмарках». Источник: OpenAI

Добавлено 6 августа 2025 года. В Yandex b2b Tech рассказали, что открыли доступ к gpt-oss-120b и gpt-oss-20b — их можно использовать по API на платформе Yandex Cloud AI Studio. В компании отметили, что при использовании моделей напрямую у разработчика, нужно передать данные для обработки за рубеж — это может не соответствовать требованиям российского законодательства. При использовании платформы от Yandex b2b Tech данные хранятся и обрабатываются в российских дата-центрах.

13
3
1
31 комментарий