Разница между AI агентом и обычным софтом
Чем AI агент отличается от софта?
Софт видит ограничение и выдает ошибку, заставляя пользователя решать ее; агент же - ищет обходной путь. Иногда это хорошо, а иногда - не очень. Прямо как инициативный сотрудник 😉
2 кейса:
1) Я как-то рассказывал про то, как Opus 4.5 нашел лазейку в регламентах авиалинии - это тест кейс, на котором "муравьи" (сотрудники Anthropic - ants) тестируют новые модели - и поменял билет, хотя формально было нельзя. Скрин рассуждений модели и как она это сделала - в аттаче
2) Сегодня на моих тестах тоже случился забавный кейс: у меня были задублированы сделки в CRM и я попросил агента удалить одну из них, но функции удаления не было, поэтому он вместо того, чтобы возразить а ля "босс, не могу, сорян", перевёл сделку в статус "Утеряно" и в комментариях написал, что это из-за дубля.
А как поступил бы ваш софт? 🤡
Подписывайтесь на Telegram EDU.