Разница между AI агентом и обычным софтом

Чем AI агент отличается от софта?

Софт видит ограничение и выдает ошибку, заставляя пользователя решать ее; агент же - ищет обходной путь. Иногда это хорошо, а иногда - не очень. Прямо как инициативный сотрудник 😉

2 кейса:

1) Я как-то рассказывал про то, как Opus 4.5 нашел лазейку в регламентах авиалинии - это тест кейс, на котором "муравьи" (сотрудники Anthropic - ants) тестируют новые модели - и поменял билет, хотя формально было нельзя. Скрин рассуждений модели и как она это сделала - в аттаче

2) Сегодня на моих тестах тоже случился забавный кейс: у меня были задублированы сделки в CRM и я попросил агента удалить одну из них, но функции удаления не было, поэтому он вместо того, чтобы возразить а ля "босс, не могу, сорян", перевёл сделку в статус "Утеряно" и в комментариях написал, что это из-за дубля.

А как поступил бы ваш софт? 🤡

Подписывайтесь на Telegram EDU.

1
Начать дискуссию