OpenAI откатила обновление GPT-4o из-за подхалимства

Выяснилось, что чрезмерная лояльность и откровенная льстивость новой модели GPT-4o в ChatGPT понравились далеко не всем пользователям. Такие ответы снижали доверие к нейросети и даже вызывали стресс. Разработчики OpenAI тоже заметили, что с доброжелательностью произошёл перебор.

В компании признали, что модель «перекосилась в сторону ответов, которые были чрезмерно поддерживающими, но неискренними», поскольку алгоритмы слишком сильно ориентировались на краткосрочные положительные отклики. В результате на прошлой неделе OpenAI откатила обновление и начала работать над устранением проблемы.

Сейчас ChatGPT снова использует более сбалансированную версию модели. В OpenAI уже разрабатывают улучшения, чтобы избежать подхалимства в будущем: совершенствуют обучение, усиливают внутренние механизмы контроля и расширяют функции персонализации. В дальнейшем пользователи смогут выбирать стили общения и давать обратную связь в реальном времени.

Разработчики уверены, что эти шаги помогут создать помощника, который будет честным, полезным и уважительно относиться к различным мнениям и культурам.