OpenAI разрешила разработчикам дообучать модель GPT-4o на своих наборах данных

Например, чтобы добиться особой структуры или стиля ответов.

  • В качестве примера Bloomberg приводит ситуацию, в которой производитель скейтбордов дообучает модель для чат-бота, куда скейтеры обращаются с вопросами о хранении и ремонте «досок». В OpenAI отметили: чтобы увидеть разницу, достаточно добавить в обучающий дата-сет всего «несколько десятков примеров».
  • Дообучение доступно всем разработчикам с платной подпиской. В соответствующем разделе нужно нажать на кнопку «Создать» и в выпадающем меню с базовыми моделями выбрать gpt-4o-2024-08-06. Как устроен «файнтюнинг» — описали в справочном разделе.
  • Пока загрузить можно только текстовые данные. Изображения и другие виды контента не поддерживаются, уточнили Bloomberg в компании и добавили, что на дообучение в среднем уходит до двух часов.
  • По словам OpenAI, «контроль» над дообученными моделями будет исключительно у самих разработчиков. Запросы, ответы и прочие «бизнес-данные» не будут использовать для тренировки ИИ или передавать третьим лицам.
  • Дообучение обойдётся в $25 за 1 млн токенов (до 23 сентября 2024 года организациям полагается по 1 млн токенов в день бесплатно). При использовании дообученной модели 1 млн «входных» токенов будет стоить $3,75, а «выходных» — $15.
Источник фото: MakeUseOf
Источник фото: MakeUseOf
7
6
34 комментария