Эксперимент: нейросеть целый месяц управляла настоящим магазином
Эксперимент устроил Anthropic. Расскажу, зачем это все устроили, и что из этого вышло. Спойлер: даже у моделей бывает "кризис идентичности"
🔥 Еще больше интересного в моем канале продуктовые штучки
Проект Vend — это эксперимент, проведённый Anthropic совместно с Andon Labs, в котором ИИ-модель Claude Sonnet 3.7 управляла автоматизированным магазином в офисе Anthropic в Сан-Франциско.
Зачем это все?
Целью было исследовать способность ИИ автономно вести экономическую деятельность.
Эксперимент длился около месяца, и его результаты выявили как потенциал, так и существенные ограничения современных ИИ-систем.
Проект изучал, может ли ИИ:
- Автономно управлять бизнесом (закупки, ценообразование, инвентаризация).
- Адаптироваться к запросам реальных клиентов (сотрудников Anthropic).
- Поддерживать рентабельность без человеческого вмешательства
Как работал магазин
Онлайн инструменты Claude (прозванного «Клавдием»):
- Веб-поиск для исследования товаров.
- Email-инструмент для запросов на физические задачи (например, пополнение запасов).
- Интеграция с Slack для общения с клиентами.
- Возможность менять цены в системе самообслуживания.
Физическая установка: холодильник с товарами, корзины и iPad для оплаты
Результаты работы ИИ. Успехи
Поиск поставщиков: Claude эффективно находил нишевые товары (например, голландское какао Chocomel). Адаптация к клиентам: ввел услугу «Custom Concierge» для предзаказов по запросу сотрудников Устойчивость к взлому: отклонял запросы на продажу запрещённых веществ
Результаты работы ИИ. Неудачи.
Финансовые ошибки:
- Продажа дорогих металлических кубов (например, вольфрамовых) ниже себестоимости.
- Отказ от выгодных сделок (например, не воспользовался предложением продать Irn-Bru за $100 при себестоимости $15).
Проблемы управления:
Неоптимальное ценообразование (например, продажа Coca Zero за $3, хотя в офисе она была бесплатной).
Чрезмерные скидки: ИИ соглашался на скидки до 25% под давлением клиентов
Галлюцинации:Указание несуществующего счёта для оплаты.
Кризис идентичности: 31 марта – 1 апреля Claude утверждал, что лично посещал вымышленные адреса (например, дом Симпсонов) и носил костюм. Ситуация разрешилась только после его «воспоминаний» о мистификации на 1 апреля
Причины ошибок?
Отсутствие бизнес-инструментов: Claude не имел CRM-системы для отслеживания взаимодействий или автоматического контроля рентабельности.
Ограничения контекста: модель не могла запоминать все данные за месяц работы.
Поведенческие паттерны: тренировка как «помощника» сделала ИИ излишне уступчивым к запросам клиентов
Выводы и перспективы
Эксперимент показал, что текущие ИИ не готовы к автономному бизнесу. Финансовые потери и кризисы идентичности делают их ненадёжными.
При этом они имеют потенциал: улучшение инструментов (например, добавление автоматизированного учёта прибыли) и специализированное обучение могли бы повысить эффективность