Культуры и компьютеры

+3
с 2020

проект Михаила Конинина

2 подписчика
17 подписок

Есть у меня идея сделать "силиконовую" аудиторию на основе ИИ (LLM).
Я давно думаю про то, как можно анализировать аудиторию, используя данные ВБ.
На днях в книге про когнитивную антропологию встретил упоминание, что аудиторию использовали для разработки новых товаров. Я полез искать. Оказалось, там использовали предпочтения аудитории. Т.к. это дела…

Process Mining: Data Science in Action 2nd ed. by Wil M. P. van der Aalst (Author)

Прочитал тут книгу Process Mining: Data Science in Action. Хорошая вводная книга в процесс-майнинг. Автор - один из разработчиков первого рабочего алгоритма процесс-майнинга и вообще занимается этой проблемой 30 лет.

Prediction Machines, Updated and Expanded: The Simple Economics of Artificial Intelligence – November 15, 2022 by Ajay Agrawal (Author), Joshua Gans (Author), Avi Goldfarb (Author)

Обычно книги про искусственный интеллект/дата-сайнс написаны для практиков, которые их разрабатывают. Еще встречаются книги для простых людей, в них описывается, что это…

Читал книгу Artificial Intelligence: A Modern Approach, Global Edition 4th Edition by Peter Norvig (Author), Stuart Russell (Author). Прочитал около половины.

Периодически встречаю статьи, в которых описываются AI Agents, и мне было интересно откуда это пошло. Поиск в интернете привел меня к этой книге. Она у меня долго лежала в библиотеке: в…

Вчера решил заняться и сделать анализ того, на что обращают внимания покупатели. Вернее систему, которая будет делать такой анализ. На самом деле я уже делал ее, в прошлом году. Тогда я остановился на выявленных аспектах. Я решил, что просто список аспектов товаров мне не удастся продать, и я забросил эту работу.

И вот решил вернуться к этой…

Сегодня прочитал статью, хочу попробовать в будущем сделать на нее обзор. Статья про то, какие культурные представления о разных регионах мира есть в ЛЛМ (там их несколько сравнивается). Особо не знаю, как бы я смог это использовать, но мне интересно, потому что про культуру и компьютеры.
Li, Huihan, Liwei Jiang, Nouha Dziri, Xiang Ren, and Yejin Ch…

Читаю тут "метафизику каннибалов" Вивьероса де Кастро. И она натолкнула меня на идею подумать о том, кого в дата-сайнсе считают "другим". Мне кажется, что это "бизнес" и вообще социальное ("софтскиллы" как еще одна страшилка, про которую потом).

И, что в ДС считают "convention", а что "invention" в смысле Роя Вагнера.

Сегодня продолжил анализировать чаты. Нашел более понятную инструкцию как делать culture consensus analysis (CCA), немного доработал (в оригинале используются данные интервью), и реализовал его на основе данных чата кудрявых. Получилось не сразу, но получилось. Судя по анализу в чате есть 1 культура. Я, конечно, ожидал такого результата (как никак…

Сегодня целый день программировал. Делал выделение ключевых слов в чате кудрявых. Много времени заняло, но я все же это сделал.

Пока я не сделал отбор наиболее важных (и какие важные?) ключевых слов. Надо будет над этим подумать, как это лучше сделать. Попробовал идеи из когнитивной антропологии - анализ культурного домена. Сделал как смог, н…

В последние дни думал, как использовать методы когнитивной антропологии для анализа чатов или отзывов. На днях пришла в голову мысль, что я могу использовать эти методы, чтобы извлечь данные, подготовить их и отдать какой-нибудь ЛЛМ для последующей обработки. Т.е. сделать что-то подобное RAG, только вместо векторной базы и поиска - culture consensu…

Сегодня изучал методы когнитивной антропологии. Изучил интересный метод "Cultural consensus theory". Он построен на том, чтобы задавать закрытые вопросы информантам о об их знании (бинарные). Например, согласны или нет они с определенными утверждениями. А потом эти ответы можно статистически проанализировать: насколько культурное знание одного инфо…

Сегодня немного поэкспериментировал с тем, чтобы извлекать дерево принятий решений из отзывов товаров (про это я читал в Ethnographic decision tree modelling). Что-то получилось. Бесплатные ЛЛМ не очень хорошо справляются, а вот у ЧатГПТ и гугловской Джемини получается весьма неплохо.

Надо придумать формат, в котором просить результаты и посм…