{"id":13887,"url":"\/distributions\/13887\/click?bit=1&hash=7417ab2efef104a137b1b3143be171aaee45d1a483569aa6063d603f727bf6c9","title":"\u041f\u043e\u044f\u0432\u0438\u043b\u0441\u044f \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442 \u0434\u043b\u044f \u0441\u0442\u0435\u0441\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u0440\u0438\u0435\u043b\u0442\u043e\u0440\u043e\u0432","buttonText":"\u041a\u0430\u043a\u043e\u0439?","imageUuid":"abccc0e8-6fcf-50df-8d84-5e30123f5434","isPaidAndBannersEnabled":false}

Как должен вести себя ИИ

Уточняем, как формируется поведение ChatGPT, планы по улучшению, больше кастомизации, больше общественного вклада в принятие решений.

Где мы сейчас

В отличии от обычного софта, у нас большие нейросети. Сначала идет пре-трейнинг, тут модели учатся предсказывать следующее слово в предложении. Затем фаза файн-тюнинга, для определения поведения системы.

Процесс не совершенен.. Главный приоритет - согласование с человеческими ценностями.

Пре-трейн происходит на большом датасете, для получения базовой модели. Далее файн-тюн на специальном датасете для того чтобы ИИ вел себя должным образом.

Роль ревьюверов (reviewers)

Важная часть процесса файн-тюнинга - обратная связь, обучаем модель, чтобы она со временем улучшалась.

Предвзятость (biases)

Изучаем, как сделать процесс файн-тюнинга более понятным и контролируемым.

Куда идем, базовые блоки будущих систем

  1. Улучшить поведение по умолчанию.
  2. Определять ваши ИИ-ценности в широких пределах. Что-бы юзеры сами могли кастомизировать поведение.
  3. Возможность влиять на правила системы для пользователей, чтобы избежать концентрации власти.

Заключение

Куда мы движемся, видно из картинки.

Много версий с разными тонкими настройками.

Лучше бы они добавили источники (ссылки, не просто текст) + альтернативные версии выдачи (возможно с разными точками зрения). И, конечно информация должна быть актуальной.

0
Комментарии
Читать все 0 комментариев
null