Как должен вести себя ИИ
Уточняем, как формируется поведение ChatGPT, планы по улучшению, больше кастомизации, больше общественного вклада в принятие решений.
Где мы сейчас
В отличии от обычного софта, у нас большие нейросети. Сначала идет пре-трейнинг, тут модели учатся предсказывать следующее слово в предложении. Затем фаза файн-тюнинга, для определения поведения системы.
Процесс не совершенен.. Главный приоритет - согласование с человеческими ценностями.
Пре-трейн происходит на большом датасете, для получения базовой модели. Далее файн-тюн на специальном датасете для того чтобы ИИ вел себя должным образом.
Роль ревьюверов (reviewers)
Важная часть процесса файн-тюнинга - обратная связь, обучаем модель, чтобы она со временем улучшалась.
Предвзятость (biases)
Изучаем, как сделать процесс файн-тюнинга более понятным и контролируемым.
Куда идем, базовые блоки будущих систем
- Улучшить поведение по умолчанию.
- Определять ваши ИИ-ценности в широких пределах. Что-бы юзеры сами могли кастомизировать поведение.
- Возможность влиять на правила системы для пользователей, чтобы избежать концентрации власти.
Заключение
Куда мы движемся, видно из картинки.
Много версий с разными тонкими настройками.
Лучше бы они добавили источники (ссылки, не просто текст) + альтернативные версии выдачи (возможно с разными точками зрения). И, конечно информация должна быть актуальной.