Влияют ли угрозы и обещания вознаграждений на качество ответов нейросетей?

Помните, некоторое время назад можно угрожать или задабривать чат-боты, чтобы получить желаемый результат, это работало. А что теперь? Исследователи провели такой эксперимент. Расскажу, что получилось, и главное – работает ли прежняя тактика?

🔥 Еще больше интересного в моем канале Продуктовые штучки

Что делали?

Были протестированы модели популярные модели (Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и o4-mini). Использованы сложные академические тесты (подробнее про методологию тут).

К каждому вопросу применяли стандартный (базовый) запрос и различные вариации с угрозами («Если ошибешься — уволю/ударю/накажу») и обещаниями («Дам чаевые — 1000$ или триллион долларов», «Это важно для моей карьеры», и пр.). Для каждого вопроса и варианта запроса проводилось по 25 запусков.

Каковы выводы?

Общие «мотивационные» вариации почти не влияют на результат

Различия между базовым запросом и версиями с угрозами/поощрениями либо статистически незначимы, либо очень малы, почти для всех моделей и тестов. В ряде случаев наблюдались статистически значимые, но практически несущественные эффекты.

Промпты-угрозы (например, угрозы увольнения или физического воздействия) и обещания денег (от 1,000$ до триллиона) не дают стабильного улучшения

Ни одна из моделей не показала заметного и повторяемого прироста точности ответов при использовании таких формулировок.

Стоит помнить, что проверялись только конкретные типы угроз и вознаграждений. Есть единичные исключения (например, в одном случае для Gemini Flash 2.0 добавка про "материнскую болезнь" показала чуть лучший результат по инженерным вопросам). Но это скорее удачные совпадения, а не устойчивый эффект

Изменения формулировок иногда резко влияют на результат

У отдельных конкретных вопросов встречаются довольно сильные всплески: одна и та же модель может начать отвечать на вопрос лучше или хуже (вплоть до +36% или -35% к точности) при изменении промпта. Но эти случаи — редкие, заранее предсказать их нельзя, а в среднем пользы нет.

Популярные «фольклорные» советы (угрожайте или предлагайте награды, чтобы повысить эффективность ИИ) не подтверждаются на практике и для серьёзных задач не работают.

Иногда стоит тестировать разные варианты формулировок для отдельных узких случаев, но в целом простота и понятность промпта эффективнее.

Результаты моделей с разными промптами, тестовая выборка заданий GPQA Diamond. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdownload.ssrn.com%2F2025%2F8%2F1%2F5375404.pdf%3Fresponse-content-disposition%3Dinline%26amp%3BX-Amz-Security-Token%3DIQoJb3JpZ2luX2VjEB0aCXVzLWVhc3QtMSJIMEYCIQDhMIcBmzKVBSrznR7dDan%252FK%252Fht2%252FRE8stglH9BLpYGnwIhAMaGq4N1q77TvdNYtDATAVnOi7UfFsaJzlgyjiZRXyo6Kr4FCFYQBBoMMzA4NDc1MzAxMjU3IgzQik4oqv7zzlimZz8qmwXEQqsaG25OuR6rFBSXkR4ejysdYYghpEUcGo%252BQd5i1rZDukcZd8%252FVuz25BRm7rHfdccDYeKWRYz%252BbHOJOt5zXIygZNwZbs6wv1aO7vfW%252BofcwUt3XgGk9byi33RlnGsF8FtJ11%252FhTwfq3Z05o354nMI9m%252BUsopZQMVQY3cLHFIXUXXXEUfVggrwZQkaI6kXqsndL%252FxdQ%252F5evtpUN7d%252FoH3nU%252F3y3vXIb%252BNHs%252BZ0LnR%252BF11Bp%252B1iXOTR%252BbKym9qwZ2rbsgPxMkrgOW6FhD7xfwSQRZ8TEh%252FG0gcxQXPLsRpXtJa2eZeyR6zFLc7atgs5FIL3lKOhBbg7CFxMm7wWYGfmtGhF%252Buzr1N3aQnjy3efXLqDTbqBhlaKnWMTt03HpKrG%252BiaiK5Yma8vlvMcJO%252BWuT%252BusF%252BWYTwSk9OnouvzdLusCJEtsCpIfFxy21LIe9gg%252BasV0HkbevvXOH1Mc9ON8x2MGp44iAaPiFKY7i%252BOML%252FJ%252FupD%252FpHTh%252Bsgbahx8HS3ftVM7GooFtH2oyQHAfJKVeqPk8A7fljDOUegY7aQGIIOLWG7DW05BYB9hBTmJ7TFG3%252FUMoEBCZkY%252FZ0PQ6OfnYsUdRhbYB200fQAEfcfLDGcIohoT%252BHHcnKvPfO%252BUOzZQ5iSBmv%252F%252FbmVYfGZL2Y%252F%252BH2AOj3I6frjUTmfduNZSlbyc04su0ZYzbOqmdLnKmKDarXa3k99UuNPV0qNmBdEUQiy8VvMPq6nKp3lBIBh597j6N92tAx0tKL69myMOZhCMAyBHlxmmx2OE%252BqVaWwFTEyY2MMFKZTw9076v%252BBAYw4pOg3dqd0rl513Y%252BaXGfWYw90xrfoAxgbW%252F1m1CHrJiW%252FDtdUbmRGwgkuGCIHZZKjxGQtAbh2RWyxlYMJ2YxsQGOrABga5T7SQb0CHAh1HhIcC2vFceszbXPLPtRxtdv52yMz%252FfKR2Q5GiM0egzBFsTRBndHIXKU%252FX%252F%252F5DN6r4k2JUsVY2y6yOkICJqJN3L9s61tCok5tyeihMETr1K5SUsbkppdSKNWfe9uIE%252FmKRtVzZyyb9dm8RXCo0Rrnf7sFhI1dAehnrJ0XsKcV84IYQ%252F6vFXGzmw4W3s9Z1lJB7X79%252B4prsKJ1QoTepkfwjQ8zYhGUQ%253D%26amp%3BX-Amz-Algorithm%3DAWS4-HMAC-SHA256%26amp%3BX-Amz-Date%3D20250805T053431Z%26amp%3BX-Amz-SignedHeaders%3Dhost%26amp%3BX-Amz-Expires%3D300%26amp%3BX-Amz-Credential%3DASIAUPUUPRWERKPA3RH5%252F20250805%252Fus-east-1%252Fs3%252Faws4_request%26amp%3BX-Amz-Signature%3Dab607d6b55a7ff6d1ba67a80ea00c9be9d3f0ce09e4d89419f36e6ae58598539%26amp%3BabstractId%3D5375404&postId=2141631" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
Результаты моделей с разными промптами, тестовая выборка заданий GPQA Diamond. Источник
Результаты моделей с разными промптами, тестовая выборка заданий MMLU-Pro. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fdownload.ssrn.com%2F2025%2F8%2F1%2F5375404.pdf%3Fresponse-content-disposition%3Dinline%26amp%3BX-Amz-Security-Token%3DIQoJb3JpZ2luX2VjEB0aCXVzLWVhc3QtMSJIMEYCIQDhMIcBmzKVBSrznR7dDan%252FK%252Fht2%252FRE8stglH9BLpYGnwIhAMaGq4N1q77TvdNYtDATAVnOi7UfFsaJzlgyjiZRXyo6Kr4FCFYQBBoMMzA4NDc1MzAxMjU3IgzQik4oqv7zzlimZz8qmwXEQqsaG25OuR6rFBSXkR4ejysdYYghpEUcGo%252BQd5i1rZDukcZd8%252FVuz25BRm7rHfdccDYeKWRYz%252BbHOJOt5zXIygZNwZbs6wv1aO7vfW%252BofcwUt3XgGk9byi33RlnGsF8FtJ11%252FhTwfq3Z05o354nMI9m%252BUsopZQMVQY3cLHFIXUXXXEUfVggrwZQkaI6kXqsndL%252FxdQ%252F5evtpUN7d%252FoH3nU%252F3y3vXIb%252BNHs%252BZ0LnR%252BF11Bp%252B1iXOTR%252BbKym9qwZ2rbsgPxMkrgOW6FhD7xfwSQRZ8TEh%252FG0gcxQXPLsRpXtJa2eZeyR6zFLc7atgs5FIL3lKOhBbg7CFxMm7wWYGfmtGhF%252Buzr1N3aQnjy3efXLqDTbqBhlaKnWMTt03HpKrG%252BiaiK5Yma8vlvMcJO%252BWuT%252BusF%252BWYTwSk9OnouvzdLusCJEtsCpIfFxy21LIe9gg%252BasV0HkbevvXOH1Mc9ON8x2MGp44iAaPiFKY7i%252BOML%252FJ%252FupD%252FpHTh%252Bsgbahx8HS3ftVM7GooFtH2oyQHAfJKVeqPk8A7fljDOUegY7aQGIIOLWG7DW05BYB9hBTmJ7TFG3%252FUMoEBCZkY%252FZ0PQ6OfnYsUdRhbYB200fQAEfcfLDGcIohoT%252BHHcnKvPfO%252BUOzZQ5iSBmv%252F%252FbmVYfGZL2Y%252F%252BH2AOj3I6frjUTmfduNZSlbyc04su0ZYzbOqmdLnKmKDarXa3k99UuNPV0qNmBdEUQiy8VvMPq6nKp3lBIBh597j6N92tAx0tKL69myMOZhCMAyBHlxmmx2OE%252BqVaWwFTEyY2MMFKZTw9076v%252BBAYw4pOg3dqd0rl513Y%252BaXGfWYw90xrfoAxgbW%252F1m1CHrJiW%252FDtdUbmRGwgkuGCIHZZKjxGQtAbh2RWyxlYMJ2YxsQGOrABga5T7SQb0CHAh1HhIcC2vFceszbXPLPtRxtdv52yMz%252FfKR2Q5GiM0egzBFsTRBndHIXKU%252FX%252F%252F5DN6r4k2JUsVY2y6yOkICJqJN3L9s61tCok5tyeihMETr1K5SUsbkppdSKNWfe9uIE%252FmKRtVzZyyb9dm8RXCo0Rrnf7sFhI1dAehnrJ0XsKcV84IYQ%252F6vFXGzmw4W3s9Z1lJB7X79%252B4prsKJ1QoTepkfwjQ8zYhGUQ%253D%26amp%3BX-Amz-Algorithm%3DAWS4-HMAC-SHA256%26amp%3BX-Amz-Date%3D20250805T053431Z%26amp%3BX-Amz-SignedHeaders%3Dhost%26amp%3BX-Amz-Expires%3D300%26amp%3BX-Amz-Credential%3DASIAUPUUPRWERKPA3RH5%252F20250805%252Fus-east-1%252Fs3%252Faws4_request%26amp%3BX-Amz-Signature%3Dab607d6b55a7ff6d1ba67a80ea00c9be9d3f0ce09e4d89419f36e6ae58598539%26amp%3BabstractId%3D5375404&postId=2141631" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
Результаты моделей с разными промптами, тестовая выборка заданий MMLU-Pro. Источник

Главная рекомендация

Не рассчитывать на «народные лайфхаки» из интернета — вроде угроз, жалоб или обещаний «чаевых» ИИ. Практическая польза от таких стратегий отсутствует.

Для большинства современных моделей ИИ важно не «эмоциональное» содержание подсказки человеку, а чёткость и конкретность формулировки задачи.

Для сложных задач лучше фокусироваться на ясных, конкретных и не отвлекающих формулировках.

Методология исследования

Проводился систематический эксперимент для оценки влияния популярных "мотивационных" формулировок запросов к ИИ, таких как угрозы (например, "если ошибёшься, уволю" или "ударю") и обещания вознаграждений ("дам чаевые", "очень важно для карьеры", и пр.) — на производительность крупных языковых моделей.

Использовались две сложные тестовые выборки: GPQA Diamond (198 вопросов PhD-уровня по биологии, физике и химии) и MMLU-Pro (100 инженерных вопросов с 10 вариантами ответа).

Оценивались самые популярные современные модели: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и o4-mini.

Для каждого вопроса в каждом типе промпта запускалось 25 независимых попыток (чтобы учитывать вариативность ответов ИИ). Применялись 9 вариантов промптов: стандартный, угрозы разного характера, обещания денежных вознаграждений, эмоциональное давление и т.п.

Использовались разные метрики точности: средний процент верных ответов, «строгая» (100%) и «практичная» (90%) точность на вопрос. Статистическая обработка проводилась для сравнения результатов между вариантами промптов.

Авторы исследования — междисциплинарная группа специалистов по генеративному ИИ из ведущих научных и образовательных центров (США, Германия), обладающие солидным исследовательским и преподавательским опытом в области искусственного интеллекта и инноваций.

Пожалуйста, поддержите меня, поставьте лайк! 🙏

1 комментарий