Исследователи несколько месяцев тайно писали ИИ-комментарии на Reddit ради науки: после «разоблачения» их аккаунты забанили, а учёных обвинили в неэтичности

Соцсеть готовит досудебную претензию к университету и исследователям.

Группа исследователей из Цюрихского университета провела многомесячный тайный и «несанкционированный» эксперимент в одном из самых популярных сообществ Reddit — r/changemyview. В этом сабреддите с 3,8 млн участников пользователи публикуют часто спорные или провокационные мнения и просят других аргументированно изменить их точку зрения.
Об эксперименте стало известно в конце апреля 2025 года. Тогда модераторы Reddit сообщили, что в марте они получили уведомление от исследователей. Учёные хотели понять, насколько «убедительными» могут быть большие языковые модели в «естественной онлайн-среде» и может ли созданный ИИ контент поменять мнение пользователей.

[…] В комментариях мы не раскрывали, что для их написания использовался ИИ, так как это сделало бы исследование невозможным. Хотя мы сами не писали комментарии, но вручную проверяли каждый опубликованный из них, чтобы убедиться, что они не наносят вреда.
Мы признаём, что наш эксперимент нарушил правила сообщества в отношении сгенерированных ИИ комментариев, и приносим извинения. Однако считаем, что с учётом высокой общественной значимости этой темы, было важно провести исследование такого рода, даже если это означает несоблюдение правил.
цитата из письма исследователей, которую привели модераторы Reddit

Согласно выдержкам из исследования, — к которым, как отмечает The Verge, стоит отнестись с большой долей скепсиса, — исследователи использовали для создания комментариев GPT-4o, Claude 3.5 Sonnet и Llama 3.1-405B.
При этом они старались персонализировать ответы: просили нейросеть определить предполагаемый пол, возраст, этническую принадлежность, местоположение и политическую позицию автора вопроса на основе его активности на Reddit. Затем эти данные учитывали в ответе. В промпте для анализа информации указали, что пользователи, участвующие в исследовании, дали своё согласие на это.
Сами же боты притворялись конкретными людьми. Например, человеком, пережившим сексуализированное насилие, или темнокожим, выступающим против движения Black Lives Matter.
С ноября 2024 года по март 2025 года нейросети прокомментировали свыше 1000 уникальных постов. Для оценки результатов исследователи смотрели на количество «дельт» — Δ (авторы ставят отметку «дельта», если их удалось переубедить), и «карму» — суммарно аккаунты набрали 10 тысяч лайков комментариев.

Команда Reddit написала, что подала в университет жалобу по поводу этичности эксперимента. Она попросила не публиковать статью, провести внутреннюю проверку, публично принести извинения пользователям, а также в будущем требовать от исследователей получать разрешение модераторов при проведении таких работ.
Главный юрист Reddit Бен Ли отметил, что эксперимент «неправильный как с моральной, так и с юридической точки зрения». По его словам, соцсеть заблокировала все аккаунты, связанные с Цюрихским университетом, и готовит досудебные претензии.
Представитель Цюрихского университета заявил, что этический комитет рекомендовал исследователям «соблюдать правила платформы», но рекомендация — это не обязанность с юридической точки зрения. Со своей стороны учебное заведение обязалось строже проверять исследования, в частности, координировать действия с сообществами на платформах до начала экспериментов.
Исследователи «по собственному желанию» решили не публиковать результаты. Из-за вопросов конфиденциальности университет не стал раскрывать их личности.

Источник: Michael Nagle / Getty Images / Wired

#редакция

Исследователи несколько месяцев тайно писали ИИ-комментарии на Reddit ради науки: после «разоблачения» их аккаунты забанили, а учёных обвинили в неэтичности

Как отреагировали Reddit и университет