Да, сама по себе GPT-3.5 удивляет своими способностями без всякой "настройки", так как её, чёрт возьми, обучали несколько месяцев на суперкомпьютере на практических всех доступных текстовых данных интернета до сентября 2021 года. Но для прикладных однотипных задач лучшую производительность показывают донастроенные (fine-tuned, customized) модели. Существуют и простые способы "настройки" модели под свою задачу, такие как few-shot learning, которые по сути требуют лишь модификации prompt'a. Но в таком случае мы будем сильно ограничены размером передаваемого текста, да и не для прикладного промптинга мы тут собрались. Хочется же чего-то посложнее?
Донастройка - fine-tuning- представляет собой передачу обучаемой модели датасета (сорри за англицизмы, так удобнее, а то пишешь "набор данных" - и сразу повеяло курсами "ML инженер за 3 месяца", а спонсора на эту интеграцию я пока не искал) с записями вида:
я нихуя не понял
Спасибо! Да, уже думаю над каналом в телеге... но чтоб его автономный агент вёл от моего имени)
Зачем соглашаться на меньшее, если можно получить лучшее?
Спасибо за статью. Написано довольно хорошо. Правда не хватает следующего:
- Поменьше намеков на рекламные интеграции) а то прерывают поток легкого чтения
- Ссылку на тг канал или акк все таки желательно. Почта уж слишком официозно. Тем более не соотносится со стилем статьи
- Ссылку бы на твой тех бэкграунд
Статья очень полезная, но было бы здорово добавить обучение для людей, по типу меня (который попросту пытается создать своего чатбота в течении месяца), где рассказывалось бы, как правильно изменить весь dataset под себя.
Спасибо!
openai проапгрейдился, теперь 1.1.1 и команды другие.
# Эта вот работает
openai tools fine_tunes.prepare_data -f training.jsonl -q
# А вот эта уже нет
openai api fine_tunes.create -t training_prepared.jsonl -m davinci --suffix "vc_gang"
пишет:
usage: openai api [-h]
{chat.completions.create,images.generate,images.edit,images.create_variation,audio.transcriptions.create,audio.translations.create,files.create,files.retrieve,files.delete,files.list,models.list,models.retrieve,models.delete,completions.create}
...
openai api: error: invalid choice: 'fine_tunes.create' (choose from 'chat.completions.create', 'images.generate', 'images.edit', 'images.create_variation', 'audio.transcriptions.create', 'audio.translations.create', 'files.create', 'files.retrieve', 'files.delete', 'files.list', 'models.list', 'models.retrieve', 'models.delete', 'completions.create')
Судя по документации, файнтюнить можно из своих пайтоновских скриптов, а вот команд, как это из CLI делать - я так и не нашел... Может, кто знает?
Не матерись в культурном обществе, ты же его слой🤣🤣🤣