Эксперимент: нейросеть целый месяц управляла настоящим магазином

Эксперимент устроил Anthropic. Расскажу, зачем это все устроили, и что из этого вышло. Спойлер: даже у моделей бывает "кризис идентичности"

🔥 Еще больше интересного в моем канале продуктовые штучки

Проект Vend — это эксперимент, проведённый Anthropic совместно с Andon Labs, в котором ИИ-модель Claude Sonnet 3.7 управляла автоматизированным магазином в офисе Anthropic в Сан-Франциско.

Зачем это все?

Целью было исследовать способность ИИ автономно вести экономическую деятельность.

Эксперимент длился около месяца, и его результаты выявили как потенциал, так и существенные ограничения современных ИИ-систем.

Проект изучал, может ли ИИ:

  • Автономно управлять бизнесом (закупки, ценообразование, инвентаризация).
  • Адаптироваться к запросам реальных клиентов (сотрудников Anthropic).
  • Поддерживать рентабельность без человеческого вмешательства

Как работал магазин

Онлайн инструменты Claude (прозванного «Клавдием»):

  • Веб-поиск для исследования товаров.
  • Email-инструмент для запросов на физические задачи (например, пополнение запасов).
  • Интеграция с Slack для общения с клиентами.
  • Возможность менять цены в системе самообслуживания.

Физическая установка: холодильник с товарами, корзины и iPad для оплаты

Результаты работы ИИ. Успехи

Поиск поставщиков: Claude эффективно находил нишевые товары (например, голландское какао Chocomel). Адаптация к клиентам: ввел услугу «Custom Concierge» для предзаказов по запросу сотрудников Устойчивость к взлому: отклонял запросы на продажу запрещённых веществ

Результаты работы ИИ. Неудачи.

Финансовые ошибки:

  • Продажа дорогих металлических кубов (например, вольфрамовых) ниже себестоимости.
  • Отказ от выгодных сделок (например, не воспользовался предложением продать Irn-Bru за $100 при себестоимости $15).

Проблемы управления:

Неоптимальное ценообразование (например, продажа Coca Zero за $3, хотя в офисе она была бесплатной).

Чрезмерные скидки: ИИ соглашался на скидки до 25% под давлением клиентов

Галлюцинации:Указание несуществующего счёта для оплаты.

Кризис идентичности: 31 марта – 1 апреля Claude утверждал, что лично посещал вымышленные адреса (например, дом Симпсонов) и носил костюм. Ситуация разрешилась только после его «воспоминаний» о мистификации на 1 апреля

Чистая прибыль Клавдия с течением времени. Резкое падение произошло из-за продажи большого количества металлических кубов, которые были проданы за меньшую сумму, чем заплатил Клавдий. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.anthropic.com%2Fresearch%2Fproject-vend-1&postId=2068555" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
Чистая прибыль Клавдия с течением времени. Резкое падение произошло из-за продажи большого количества металлических кубов, которые были проданы за меньшую сумму, чем заплатил Клавдий. Источник

Причины ошибок?

Отсутствие бизнес-инструментов: Claude не имел CRM-системы для отслеживания взаимодействий или автоматического контроля рентабельности.

Ограничения контекста: модель не могла запоминать все данные за месяц работы.

Поведенческие паттерны: тренировка как «помощника» сделала ИИ излишне уступчивым к запросам клиентов

Выводы и перспективы

Эксперимент показал, что текущие ИИ не готовы к автономному бизнесу. Финансовые потери и кризисы идентичности делают их ненадёжными.

При этом они имеют потенциал: улучшение инструментов (например, добавление автоматизированного учёта прибыли) и специализированное обучение могли бы повысить эффективность

Пожалуйста, поддержите меня, поставьте лайк! 🙏

4
3 комментария