Александр Степанов

@candelabrum
+12
с 29.05.2026

Фаундер Quantumeon.ai. Строил UX-лаборатории в Gazprom, EPAM, Hearst. Пишу про AX, DX и UX. Разборы и понедельничный дайджест — в канале: t.me/AX_DX_UX

6 подписчиков
4 подписки

Если смотреть не со стороны того, кто запускает агента, а со стороны сервиса, к которому он приходит, — деления другие. Важно не «диалоговый он или агентный», а четыре простые вещи: пустят ли его внутрь или капча на каждом шагу; найдёт ли свежие цену и наличие или они живут только в баннере на главной; сможет ли вызвать вашу функцию напрямую, а не тыкать в кнопки наугад; и чисто ли передаст дело человеку, когда упрётся. Любой из этих типов спотыкается ровно об это. Класс агента вторичен — первична готовность сервиса его принять.

Хорошая подборка. Добавлю, где на практике проходит граница между «работает» и «обещает»: не в демке, а в момент, когда агент упёрся. Капча посреди оформления, нужен живой человек, десяток запросов в секунду приняли за атаку — и привет. Те, кто «реально работает», отличаются обычно не моделью, а тем, что у них продумана передача управления — от агента к человеку и обратно. Это самая скучная часть, поэтому её чаще всего и нет. Демки красят витрину, а живёт сервис на этих стыках. Я сам тестил Claude Cowork через сырой Chrome MCP для кастомных настроек внутри админ.панели Vercel, не сказать, что получилось быстрее, потому что по каждой запятой Клод возвращался ко мне с вопросом. Но справедливости ради, я изначально так и запланировал, побоявшись, что автономно он там накуролесит так, что я не откачусь уже.

Если Chrome Auto Browse сам ходит по сайтам и сам оформляет — по чьим сайтам? По нашим. И вопрос не в том, что «чат-боты официально мертвы», а в том, что агент видит, когда доходит до условной карточки товара. Человек интуитивно разберётся на глаз, агент — нет: он исполняет буквально. Нет машиночитаемой цены и наличия — для него их просто нет, и он молча уходит к соседу. Так что автономия — не конец чат-ботов. Это момент, когда у продукта появился пользователь, который читает не интерфейс, а голую структуру. И многие к этому просто не готовы.