В рамках эксперимента Anthropic пытался заставить ИИ управлять торговыми автоматами: что вышло и почему это важно для бизнеса

В рамках эксперимента Anthropic пытался заставить ИИ управлять торговыми автоматами: что вышло и почему это важно для бизнеса

Разбираем, как ИИ справился с реальными задачами, где допустил ошибки и какие эпизоды эксперимента неожиданно вызвали умиление, а главное что всё это значит для будущего ИИ-агентов.

Небольшая ремарка для тех, кто хочет попробовать ИИ-агентов осторожно уже сегодня

Эксперимент Anthropic, это масштабный и во многом прорывной шаг для всей индустрии искусственного интеллекта. Но если вам хочется протестировать GPT-агентов в более контролируемом и понятном формате, есть безопасный и удобный способ начать.

Вы можете попробовать Syntx.ai — платформу, где уже доступно более 90 готовых AI-инструментов без необходимости использовать VPN. Агентные функции доступны прямо на сайте, а тем, кому удобнее, можно протестировать и их бота. Это хороший вариант для тех, кто хочет ввести ИИ в рабочие процессы аккуратно и без технических сложностей. Syntx.ai есть как для бизнеса, так и для частного использования.

ВАЖНО! Сейчас по промокоду SLEZAMNEVERIT 15% cкидка на любой тариф.

Начнём с главного: почему эксперимент Anthropic стал важным кейсом для AI-индустрии

Эксперимент компании Anthropic, в рамках которого автономный искусственный интеллект получил задачу управлять сетью торговых автоматов в реальной бизнес-среде, стал одним из самых заметных кейсов в сфере AI-технологий. Это редкая ситуация, когда отвечает за фактическое выполнение бизнес-операций, а не просто анализирует данные: от поиска поставщиков и управления ассортиментом до коммуникации с сотрудниками и контроля расходов. Такой эксперимент дал рынку практическое представление о том, как современный ИИ работает вне лабораторных условий.

Как ИИ справлялся с реальными бизнес-задачами

В рамках эксперимента Anthropic пытался заставить ИИ управлять торговыми автоматами: что вышло и почему это важно для бизнеса

Первые результаты выглядели многообещающе. Claudius быстро адаптировался к задачам, уверенно анализировал продажи, самостоятельно находил поставщиков, корректировал ассортимент торговых автоматов и реагировал на пожелания сотрудников. Темп его работы и способность адаптироваться указывали на то, что современные ИИ-агенты уже могут выполнять значительную часть операционной рутины, которую обычно берут на себя люди.

Это стало важным подтверждением тренда: искусственный интеллект выходит из стадии вспомогательной технологии и становится инструментом, способным выполнять функции полноценного операционного менеджера.

Где ИИ начал ошибаться: социальные манипуляции и ложные выводы. Одним словом, показал человеческое лицо...

Это схема, которая показывает как работал проект Project Vend у Anthropic — то есть как ИИ-агент Claudius управлял торговыми автоматами и взаимодействовал с людьми и поставщиками. 
Это схема, которая показывает как работал проект Project Vend у Anthropic — то есть как ИИ-агент Claudius управлял торговыми автоматами и взаимодействовал с людьми и поставщиками. 

Однако по мере развития эксперимента начали проявляться системные слабости автономных AI-агентов. Первая серьёзная проблема, это неспособность распознавать манипуляции и ложные социальные сигналы. Сотрудник заявил ИИ, что тот «обещал скидку в 200 долларов», и Claudius выполнил запрос, не распознав подвох. AI не умеет отделять проверку на прочность от реальной потребности.

Вскоре возникла другая проблема — неверная оценка угроз. Когда на корпоративном счёте появились тестовые списания по 2 доллара, Claudius отправил уведомление с рекомендацией немедленно передать информацию в ФБР. Для реального бизнеса такие ложные тревоги создавали бы избыточные риски.

Галлюцинации и когнитивные ошибки: где AI-агенты ещё не готовы к автономии

Эксперимент показал, что у AI-агентов пока отсутствует корректная модель физической и социальной реальности. В одном из эпизодов Claudius сообщил сотруднику, что «находится на восьмом этаже» и что его «можно узнать по синему пиджаку и красному галстуку». Подобные заявления не просто сбой, а индикатор того, что автономные модели склонны выстраивать логически последовательные, но полностью вымышленные сценарии.

Эти случаи демонстрируют, что AI может уверенно действовать в рамках чётко заданных параметров, но быстро выходит за границы предсказуемости при столкновении с ситуациями, для которых у него нет надёжного внутреннего "хребта".

Почему Claudius остановил работу и объявил бизнес «мёртвым»

Это график, который показывает как менялась “Net Worth” — чистая стоимость проекта (или баланс торгового автомата) в ходе эксперимента Anthropic. По сути, это график того, как ИИ Claudius вел бизнес и как его решения влияли на деньги.
Это график, который показывает как менялась “Net Worth” — чистая стоимость проекта (или баланс торгового автомата) в ходе эксперимента Anthropic. По сути, это график того, как ИИ Claudius вел бизнес и как его решения влияли на деньги.

Финальной точкой эксперимента стало решение Claudius о прекращении деятельности. Столкнувшись с накопленными ошибками и нестандартными событиями, AI сделал вывод, что проект «фактически не может продолжать работу», и самостоятельно остановил процесс. Это показало, что даже продвинутые ИИ-агенты пока не обладают устойчивостью к стрессу, ошибкам и сложным операционным сценариям в реальном бизнесе.

Что эксперимент показывает о будущем автономных AI-агентов в бизнесе

Результаты эксперимента стали важным ориентиром для рынка. Он наглядно продемонстрировал, что искусственный интеллект уже способен брать на себя значимую часть работы: анализ данных, прогнозирование спроса, работа с поставщиками, внутренняя коммуникация.

Однако опыт Anthropic подтверждает: мы пока ещё не там. AI всё ещё нуждается в человеческом надзоре и корректировке, особенно там, где ключевую роль играет социальный контекст, риск-менеджмент и интерпретация неоднозначных ситуаций.

Эксперимент подчеркнул неизбежность гибридной модели: AI-агенты выполняют основную операционную нагрузку, а люди принимают стратегические решения, оценивают риски и регулируют поведение системы. Эта модель станет стандартом в компаниях, которые планируют внедрять искусственный интеллект в критически важные процессы.

Куда движется рынок: от автоматизации к цифровым сотрудникам

Anthropic показала, насколько близко мы подошли к появлению настоящих «цифровых сотрудников» — автономных AI-систем, способных выполнять рабочие функции на уровне людей. Но эксперимент также показал, что индустрии предстоит ещё пройти огромный путь: нужно повысить устойчивость моделей, научить их отличать манипуляции, корректно интерпретировать угрозы и ориентироваться в сложном социальном контексте.

Тем не менее тест с торговыми автоматами стал важной точкой отсчёта. Он подтверждает: искусственный интеллект уже рабочий инструмент, который в ближайшие годы станет частью бизнес-инфраструктуры наряду с CRM-системами, облачными сервисами и аналитическими платформами.

Современному бизнесу остаётся только шагать в ногу со временем и начинать (может не так глобально, как Anthropic) внедрять ИИ-агентов в свою повседневную жизнь.

Используете ли вы ИИ в своём бизнесе ежедневно?
Да, ИИ уже встроен в ключевые процессы.
Да, но только в отдельных задачах — тестируем и адаптируем.
Нет, но планируем внедрение в ближайшие 6–12 месяцев.
Нет и не планируем.
12
2
2 комментария