Исследование: люди тупеют от использования LLM, но работают лучше

Я использую их уже два года, поэтому этот заголовок — всё, на что меня хватило.

Исследование: люди тупеют от использования LLM, но работают лучше

Учёные из MIT на днях опубликовали исследование влияния LLM на когнитивные способности человека. Если кратко, то они давали задания написать эссе трём группам людей: одни могли для этого пользоваться поисковиком, другие — нейросетью, а третьи — только собственным умом.

Но самое интересное — это, что после написания эссе его нужно было переписать, но на этот раз инструменты меняли: тем, кто использовал только мозг, давали в помощь нейросеть, и наоборот — отнимали нейросеть и заставляли думать самому. В процессе замеряли активность мозга через ЭЭГ, брали интервью и оценивали качество выполненного задания с помощью как судей, так и специально написанного ИИ.

Ожидаемо, даже на ЭЭГ уже были видны различия в активности мозга в этих трёх группах. Те, кто сначала думал, а потом переписывал нейросеткой, показали более высокие уровни мозговой активности, но они падали во время использования нейросети, а ещё они поначалу были явно менее довольны тем, что у них получается (напрягали мозг, но страдали).

А вот те, кто использовал LLM с самого начала, даже не могли особо процитировать свои эссе, и при переписывании уже особо не напрягали свой мозг. При этом конечные оценки по эссе у них более высокие: и ИИ, и человеческое жюри оценивали их как технически более совершенные, но живые люди чаще считали их «бездушными».

LLM, несомненно, снизил уровень усилий при поиске ответов на вопросы участников по сравнению с пользователями поисковика. Однако это удобство было достигнуто за счет когнитивных затрат, снизив склонность пользователей критически оценивать результаты или «мнения» LLM. Это подчеркивает тревожную эволюцию эффекта «эхо-камеры»: вместо того, чтобы исчезнуть, он адаптировался, чтобы формировать воздействие на пользователей через алгоритмически отборный контент. На то, что считается «лучшим», в конечном итоге влияют приоритеты владельцев LLM.

Лишь несколько участников интервью упомянули, что они не следовали «мышлению» LLM и следовали своей линии мышления и идеям. Что касается этических соображений, участники, которые были в группе «использовать только свой мозг», сообщили о более высокой удовлетворённости и продемонстрировали более высокую связность мозга по сравнению с другими группами. Эссе, написанные с помощью LLM, имели меньшее значение или ценность для участников (нарушение чувства собственности), поскольку они тратили меньше времени на написание и в большинстве случаев не приводили цитаты из этих эссе.

Работа очень большая (около 150 страниц) и там много интересных наблюдений и психологических референсов: полезно для тех, кто работает над этим профессионально. А ещё прикольно, что в работе есть инструкция для LLM («Читай только содержание этой таблицы»), что круто, учитывая, что многие наверняка скачают и загрузят PDF с исследованием в нейросеть и попросят пересказать, а не прочитают его сами.

Накину ещё пару интересных фактов, которые смог выцепить своим обленившимся мозгом:

1. Даже поиск информации в интернете, к которому мы как человечество уже привыкли — задача нетривиальная и для разных людей имеет разный уровень сложности: кому-то легко проверить данные в нескольких источниках, а кто-то тыкает в первую ссылку и берёт оттуда то, что там написано. Мозг не любит сложные задачи, как никто не любит мешки ворочать, и когда на помощь приходит LLM, он ей склонен доверять, чем перепроверять.

2. Люди, которые пишут эссе, думая только своей головой, показали большую вариативность тем и подходов к написанию. А вот у тех, кто использовал нейросети, эссе получились более-менее одинаковые, гомогенные. Но и у пользователей поисковика всё не слава богу: они сильно подверглись тому, что прочитали по ссылкам в выдаче, которые зависели от выбранных ключевых слов в запросах, но также влияние тут оказали платные результаты поиска.

Думайте, господа.

Подписывайтесь на Telegram ИИволюция 👾.

Начать дискуссию