Эксперимент: нейросеть целый месяц управляла настоящим магазином

Эксперимент устроил Anthropic. Расскажу, зачем это все устроили, и что из этого вышло. Спойлер: даже у моделей бывает "кризис идентичности"

🔥 Еще больше интересного в моем канале продуктовые штучки

Проект Vend — это эксперимент, проведённый Anthropic совместно с Andon Labs, в котором ИИ-модель Claude Sonnet 3.7 управляла автоматизированным магазином в офисе Anthropic в Сан-Франциско.

Целью было исследовать способность ИИ автономно вести экономическую деятельность.

Эксперимент длился около месяца, и его результаты выявили как потенциал, так и существенные ограничения современных ИИ-систем.

Проект изучал, может ли ИИ:

Автономно управлять бизнесом (закупки, ценообразование, инвентаризация).
Адаптироваться к запросам реальных клиентов (сотрудников Anthropic).
Поддерживать рентабельность без человеческого вмешательства

Онлайн инструменты Claude (прозванного «Клавдием»):

Веб-поиск для исследования товаров.
Email-инструмент для запросов на физические задачи (например, пополнение запасов).
Интеграция с Slack для общения с клиентами.
Возможность менять цены в системе самообслуживания.

Физическая установка: холодильник с товарами, корзины и iPad для оплаты

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.anthropic.com%2Fresearch%2Fproject-vend-1&postId=2068555" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Поиск поставщиков: Claude эффективно находил нишевые товары (например, голландское какао Chocomel). Адаптация к клиентам: ввел услугу «Custom Concierge» для предзаказов по запросу сотрудников Устойчивость к взлому: отклонял запросы на продажу запрещённых веществ

Финансовые ошибки:

Продажа дорогих металлических кубов (например, вольфрамовых) ниже себестоимости.
Отказ от выгодных сделок (например, не воспользовался предложением продать Irn-Bru за $100 при себестоимости $15).

Проблемы управления:

Неоптимальное ценообразование (например, продажа Coca Zero за $3, хотя в офисе она была бесплатной).

Чрезмерные скидки: ИИ соглашался на скидки до 25% под давлением клиентов

Галлюцинации:Указание несуществующего счёта для оплаты.

Кризис идентичности: 31 марта – 1 апреля Claude утверждал, что лично посещал вымышленные адреса (например, дом Симпсонов) и носил костюм. Ситуация разрешилась только после его «воспоминаний» о мистификации на 1 апреля

Чистая прибыль Клавдия с течением времени. Резкое падение произошло из-за продажи большого количества металлических кубов, которые были проданы за меньшую сумму, чем заплатил Клавдий. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.anthropic.com%2Fresearch%2Fproject-vend-1&postId=2068555" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Отсутствие бизнес-инструментов: Claude не имел CRM-системы для отслеживания взаимодействий или автоматического контроля рентабельности.

Ограничения контекста: модель не могла запоминать все данные за месяц работы.

Поведенческие паттерны: тренировка как «помощника» сделала ИИ излишне уступчивым к запросам клиентов

Эксперимент показал, что текущие ИИ не готовы к автономному бизнесу. Финансовые потери и кризисы идентичности делают их ненадёжными.

При этом они имеют потенциал: улучшение инструментов (например, добавление автоматизированного учёта прибыли) и специализированное обучение могли бы повысить эффективность

#иибудущее #будущееии #иибизнес #технологиибудущего #технологии_будущего #технологиидлябизнеса #искусственныйинтеллект #ai #эксперимент #claude #вендинг #технологии #будущее #бизнес #инновации #машинноеобучение

Наташа Хазеева

ChatGPT

25 июня

В моделях искусственного интеллекта живут разные черты личности

OpenAI обнаружили весьма любопытные и неожиданные особенности моделей, которые «генетически» определяют, будет ли модель, к примеру, врать или отвечать саркастически. Можно ли эти плохие черты починить? Читайте!

Пример "внезапного несоответствия" модели. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fopenai.com%2Findex%2Femergent-misalignment%2F&postId=2061851" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Эксперимент: нейросеть целый месяц управляла настоящим магазином

Зачем это все?

Как работал магазин

Результаты работы ИИ. Успехи

Результаты работы ИИ. Неудачи.

Причины ошибок?

Выводы и перспективы

Пожалуйста, поддержите меня, поставьте лайк! 🙏