Охота на информацию с использованием ИИ

Теория охоты на информацию (она же «информационно-продовольственная теория», information foraging theory) – это подход к изучению того, как стратегии поиска, сбора и потребления информации адаптируются к окружающей среде. Она была сформулирована в 1990-х годах исследователями Питером Пиролли (Peter Pirolli) и Стюартом Кардом (Stuart Card).

Краткое введение в теорию охоты на информацию

Она основана на теории оптимального поиска пропитания (optimal foraging theory), которая моделирует поведение животных при поиске еды с максимально возможным результатом и минимально возможными затратами энергии. Пиролли и Кард заметили, что человек при поиске информации демонстрирует похожее поведение. Они ввели такие понятия, как «фрагменты информации» (information patches), «аромат информации» (information scent) и «информационная диета» (information diet). И мне невероятно нравится эта теория.

Мне вообще всегда казалось, что есть очень глубокий смысл в выражении «пища для ума» и что мы не просто так говорим «меня уже тошнит от этой информации» или «она голодная до знаний» и всё в этом роде. Когда я впервые познакомилась с теорией охоты на информацию, я подумала, что это гениально.

Теория оптимального поиска пропитания рассматривает ситуации, в которых окружающая среда имеет фрагментированную структуру. Например, есть некая птичка, которая питается ягодами, а ягоды растут на кустах, и кусты расположены на некотором удалении друг от друга. Находясь на одном из кустов, птичка может либо оставаться на нём и есть ягоды, либо искать другой куст. Решение зависит от того, стоит ли конкретный куст проведённого на нём дополнительного времени. И стоит ли следующий куст затрат энергии на его поиск.

Если мы говорим об информации, в роли фрагмента может выступать книга, сайт, ящик с документами и так далее. Найдя один фрагмент информации, человек принимает решение о том, искать ли следующий или исследовать этот фрагмент дальше. Не задумываясь, он будет распределять время между разведкой (поиском информации) и исследованием так, чтобы объём и ценность полученной информации были как можно выше, а трудозатраты на её поиск и обработку – как можно ниже.

Важным отличием человека от птички здесь является то, что человек может модифицировать окружающую среду так, чтобы сократить свои затраты на поиск. К примеру, он может организовать книжный шкаф таким образом, чтобы книги на одну тему стояли рядом. Или он может поработать над поисковым запросом таким образом, чтобы в результатах было больше полезных для него ссылок. Здесь он тоже сталкивается с необходимостью принимать решение: продолжать модифицировать среду (например, менять свой запрос) или приступать к исследованию обнаруженного фрагмента информации.

Птички вроде бы полагаются больше на зрение и слух, чем на обоняние, поэтому теперь представим себе ежа. У него окружающая среда тоже фрагментированная, и он перемещается от одного червяка к другому, вынюхивая их в лесной подстилке. До этого поста я не думала, что червяки чем-то пахнут. Справедливости ради, мне просто не приходило в голову нюхать червяков.

Для человека аромат информации – это неполные её фрагменты: библиографические ссылки, термины, которые не совсем отвечают на вопрос, но помогают его точнее сформулировать, и так далее. Особенно мы полагаемся на аромат информации, когда ищем что-то, о чём имеем очень приблизительное представление.

Если у животного есть выбор из нескольких потенциальных источников пищи, оно будет выбирать такой, для которого отношение затрат на добычу к получаемому от неё насыщению будет наилучшим. К примеру, львица не станет ловить мышей, даже если их вокруг полно.

Человек скорее предпочтёт потратить время и поискать хороший обзор на новые часы, чем разгребать спам у себя в почтовом ящике в поисках крупиц полезной информации среди груд рекламного мусора.

Красота теории охоты на информацию в том, что она хорошо описывает реальные процессы: то, как мы проводим разведку, когда не чувствуем аромата искомой информации; как собираем то, что может пригодиться в будущем; как просматриваем источники по диагонали, не погружаясь в детали, чтобы понять, правильно они пахнут или нет и так далее. В конце концов, мы стараемся сделать так, чтобы на единицу пространства – виртуального или реального – приходилось как можно больше единиц информации.

Начиная со страницы 6 в статье Пиролли и Карда приведено два примера: наблюдательные исследования работы аналитика и группы студентов. Там прям в стиле передач Дроздова описано, какую кто искал информацию, куда клал статьи и так далее. Почитайте, это занимательно.

Наконец, авторы говорят о том, что поиск информации можно рассматривать в терминах совместной адаптации людей и их информационного окружения. Существует своего рода давление механизмов эволюционного отбора и на информационное окружение, и на человека – подобно тому, как существует давление среды на поведение животных при поиске пропитания.

Разумеется, у этой теории есть ограничения и допущения, в рамках которых она работает. Но тем не менее.

Охота на информацию с ИИ

Статья «Information foraging in human-ChatGPT interactions: factors of computational thinking dissociate exploration and exploitation» («Охота на информацию во взаимодействии человека и СhatGPT: факторы вычислительного мышления разделяют разведку и исследование»), ради которой затевался этот пост, опубликована в 2024 году.

«Вычислительное мышление» («computational thinking») – очередной дурной перевод без перевода. Этот мыслительный процесс, который формулирует задачи так, чтобы решение могло бы быть представлено в виде исполняемой компьютером программы.

Авторы пишут следующее:

Большие языковые модели могут взаимодействовать [с пользователем] так, как будто понимают человеческую речь. Но это по-прежнему алгоритмы и могут быть использованы как таковые.

Вопрос: как навык вычислительного мышления (то есть, грамотной работы с алгоритмами) меняет поведение пользователя в процессе охоты на информацию, когда он работает с СhatGPT?

В качестве лабораторных людей взяли исследователей, которые работают над докторской диссертацией («doctoral researchers» – похоже, это они). Здесь мы делаем пометку о том, что имеем дело с очень искажённой выборкой: в одном из предыдущих постов мы выяснили, что более и менее продвинутые в области пользователи используют разные стратегии при работе с ИИ. Кроме того, участников было всего девять, все в возрасте от 30 до 40 лет.

Авторы приводят ссылки на исследования, которые затрагивают взаимосвязи между навыком вычислительного мышления и использованием нейросетей. Я кое-что отложила для анализа, потому что, кажется, это, работы о том, что «ИИ развивает Х», а не «ИИ лишает нас Х». И, похоже, развитие этого навыка очень важно для жизни в мире будущего. Обсудим, но уже ближе к зиме, пожалуй.

Сейчас перечитываю пост перед публикацией и поняла, что делаю запасы информации на зиму.

Итак, всем участникам выдали шесть шаблонов запросов и набор ключевых слов по семи разным категориям. Среди промптов были разведочные – для поиска информации – и исследовательские – для анализа найденных источников. Участникам предлагалось дополнить шаблоны запросов, используя ключевые слова. Им также можно было добавлять новые ключевые слова, которые они получали из сгенерированных ИИ текстов.

Чтобы оценить вычислительное мышление, использовали специально разработанную для этой цели шкалу. По ней оцениваются пять компонентов вычислительного мышления:

· творческое мышление (creativity);

· алгоритмическое мышление (algorithmic thinking);

· навык совместной работы (cooperativity);

· критическое мышление (critical thinking);

· навык решения задач (problem solving).

Это опросник со шкалой Лайкерта: для каждого компонента есть список вопросов, на каждый из которых нужно ответить числом от 1 до 5, где

· 1 – никогда;

· 2 – редко;

· 3 – иногда;

· 4 – обычно;

· 5 – всегда.

Примеры вопросов для оценки алгоритмического мышления:

· «Я думаю, что меня особенно интересует математика»;

· «Я считаю, что могу быстро найти взаимосвязи между графиками».

И так далее.

Участники активно использовали ключевые слова, предложенные СhatGPT, отходя от заранее подготовленного списка, но в рамках темы исследования. При этом в процессе разведки чаще использовали заранее подготовленные термины, а для исследования более активно полагались на СhatGPT.

Заключение

Я не буду приводить цифры из этого исследования, потому что они получены на девяти участниках и толку в них мало. Однако прочтение этой статьи полезно по двум причинам.

Во-первых, потому что влияние ИИ на то, как мы ведём разведочный поиск – интересная тема. ИИ дал этой области хороший толчок, и развиваться в ней или отслеживать её развитие полезно.

Во-вторых, потому что эта статья помогла мне наткнуться на термин «вычислительное мышление», за которым, похоже, много что стоит. Это может быть один из ценных навыков будущего, и я дальше буду обращать внимание на публикации в этой теме.

Короче говоря, иногда самая питательная часть статьи – список литературы.

Заходите ко мне в телеграм, я всем интересным там всегда делюсь.

1
Начать дискуссию