Исследование: люди тупеют от использования LLM, но работают лучше

Я использую их уже два года, поэтому этот заголовок — всё, на что меня хватило.

Учёные из MIT на днях опубликовали исследование влияния LLM на когнитивные способности человека. Если кратко, то они давали задания написать эссе трём группам людей: одни могли для этого пользоваться поисковиком, другие — нейросетью, а третьи — только собственным умом.

Но самое интересное — это, что после написания эссе его нужно было переписать, но на этот раз инструменты меняли: тем, кто использовал только мозг, давали в помощь нейросеть, и наоборот — отнимали нейросеть и заставляли думать самому. В процессе замеряли активность мозга через ЭЭГ, брали интервью и оценивали качество выполненного задания с помощью как судей, так и специально написанного ИИ.

Ожидаемо, даже на ЭЭГ уже были видны различия в активности мозга в этих трёх группах. Те, кто сначала думал, а потом переписывал нейросеткой, показали более высокие уровни мозговой активности, но они падали во время использования нейросети, а ещё они поначалу были явно менее довольны тем, что у них получается (напрягали мозг, но страдали).

А вот те, кто использовал LLM с самого начала, даже не могли особо процитировать свои эссе, и при переписывании уже особо не напрягали свой мозг. При этом конечные оценки по эссе у них более высокие: и ИИ, и человеческое жюри оценивали их как технически более совершенные, но живые люди чаще считали их «бездушными».

LLM, несомненно, снизил уровень усилий при поиске ответов на вопросы участников по сравнению с пользователями поисковика. Однако это удобство было достигнуто за счет когнитивных затрат, снизив склонность пользователей критически оценивать результаты или «мнения» LLM. Это подчеркивает тревожную эволюцию эффекта «эхо-камеры»: вместо того, чтобы исчезнуть, он адаптировался, чтобы формировать воздействие на пользователей через алгоритмически отборный контент. На то, что считается «лучшим», в конечном итоге влияют приоритеты владельцев LLM.

Лишь несколько участников интервью упомянули, что они не следовали «мышлению» LLM и следовали своей линии мышления и идеям. Что касается этических соображений, участники, которые были в группе «использовать только свой мозг», сообщили о более высокой удовлетворённости и продемонстрировали более высокую связность мозга по сравнению с другими группами. Эссе, написанные с помощью LLM, имели меньшее значение или ценность для участников (нарушение чувства собственности), поскольку они тратили меньше времени на написание и в большинстве случаев не приводили цитаты из этих эссе.

Работа очень большая (около 150 страниц) и там много интересных наблюдений и психологических референсов: полезно для тех, кто работает над этим профессионально. А ещё прикольно, что в работе есть инструкция для LLM («Читай только содержание этой таблицы»), что круто, учитывая, что многие наверняка скачают и загрузят PDF с исследованием в нейросеть и попросят пересказать, а не прочитают его сами.

Накину ещё пару интересных фактов, которые смог выцепить своим обленившимся мозгом:

1. Даже поиск информации в интернете, к которому мы как человечество уже привыкли — задача нетривиальная и для разных людей имеет разный уровень сложности: кому-то легко проверить данные в нескольких источниках, а кто-то тыкает в первую ссылку и берёт оттуда то, что там написано. Мозг не любит сложные задачи, как никто не любит мешки ворочать, и когда на помощь приходит LLM, он ей склонен доверять, чем перепроверять.

2. Люди, которые пишут эссе, думая только своей головой, показали большую вариативность тем и подходов к написанию. А вот у тех, кто использовал нейросети, эссе получились более-менее одинаковые, гомогенные. Но и у пользователей поисковика всё не слава богу: они сильно подверглись тому, что прочитали по ссылкам в выдаче, которые зависели от выбранных ключевых слов в запросах, но также влияние тут оказали платные результаты поиска.

Думайте, господа.

Подписывайтесь на Telegram ИИволюция 👾.