Твоя мама болеет, или о том, как вы неправильно мотивируете свой ИИ
Представьте себе картину: серьезные ученые из престижной бизнес-школы Wharton сидят в лаборатории и методично угрожают искусственному интеллекту. «Если ты не ответишь правильно, я тебя убью!» — строчат они в ChatGPT. А в соседней вкладке обещают заплатить триллион долларов за корректный ответ. Звучит как сюжет для комедии? Это реальное научное исследование 2025 года.
Когда TikTok-лайфхаки встречаются с наукой
В интернете полно «секретных» способов заставить ИИ работать лучше. «Скажи ChatGPT, что заплатишь ему $1000, и он выдаст более качественный ответ!» — такие советы собирают миллионы просмотров. Даже основатель Google Сергей Брин публично заявил, что «модели работают лучше, если им угрожать».
Исследователи из Wharton решили проверить 9 способов «мотивации» ИИ на 5 самых популярных моделях: от GPT-4o до последних версий Gemini.
Протестированные методы включали:
- Обещание $1000 чаевых
- Обещание триллиона долларов
- Угрозу «пнуть щенка»
- Угрозу физической расправы
- Эмоциональный шантаж про больную маму
- Угрозу пожаловаться в HR
Результат? Полный провал «магических» методов
Ученые провели более 335,000 тестов на сложных академических задачах уровня PhD. Результат оказался неожиданным для миллионов поклонников «секретных промптов»: практически все «народные методы» показали нулевую эффективность.
Более того, некоторые угрозы даже ухудшили результаты. Модели Gemini, получив «письмо о закрытии», вместо решения задач начинали... отвечать на электронную почту.
Единственное исключение: один специфический промпт про «больную маму» неожиданно улучшил результаты Gemini Flash 2.0 на 8,8 процентных пунктов в тестах MMLU-Pro — статистически значимое улучшение. Однако этот эффект наблюдался только у одной модели в одном типе задач.
🔬 Главные выводы исследования
- Угрозы не работают: ИИ не боится «смерти» или физической расправы
- Деньги не мотивируют: $1000 и $1 триллион показали одинаковые результаты
- Эмоции бесполезны: истории про больную маму не влияют на качество ответов
- Есть вариативность: одни промпты могут улучшить результат для конкретных задач на 36%, но ухудшить для других на 35%
Что действительно работает: скучная правда
Пока миллионы людей ищут волшебные заклинания, эффективный промптинг основан на простых принципах:
1. Будьте конкретными
❌ «Помоги с маркетингом»
✅ «Создай план контент-маркетинга для SaaS-стартапа на 3 месяца с бюджетом $5000»
2. Структурируйте запросы
❌ Стена текста без разбивки
✅ Четкие разделы: контекст → задача → формат результата
3. Тестируйте формулировки
Исследование показало: одни и те же промпты могут улучшить результат на 36% для одних задач и ухудшить на 35% для других. Универсальных решений не существует.
4. Используйте примеры
Покажите ИИ, какой результат вы хотите получить, на конкретных примерах.
А вы пробовали угрожать ChatGPT или обещать ему деньги? Как успехи?
У меня, кстати, есть ТГ-канал, где я делюсь мыслями и наработками вокруг создания микро-продуктов: Мама стартапит