Ваш ИИ-агент проиграл торги. Готовьтесь платить

Представьте себе будущее, в котором ваш финансовый успех зависит не от вашего умения вести переговоры, а от того, какую версию ИИ-помощника вы можете себе позволить.

В новом исследовании, опубликованном на arXiv, учёные из Стэнфорда смоделировали рыночную ситуацию: одни ИИ-агенты выступали в роли покупателей, другие — в роли продавцов электроники, автомобилей и недвижимости. Цель продавца — максимизировать прибыль. Цель покупателя — сбить цену.

Каждому агенту давали лишь часть информации, имитируя реальные условия торга, где никто не знает всех карт противника.

📉 Цифровое неравенство в действии

Победителем из большинства схваток вышел o3 от OpenAI, за ним следовали GPT-4.1 и o4-mini4. А вот старичок GPT-3.5 потерпел унизительное поражение: в роли продавца он зарабатывал меньше всех, а в роли покупателя — тратил больше всех. Это похоже на выход в суд с опытным адвокатом против новичка: вы играете по одним правилам, но шансы изначально не равны.

Авторы исследования перевели это в конкретные цифры. Если покупатель со «слабым» ИИ (например, GPT-3.5) торгуется с продавцом с «сильным» ИИ (DeepSeek-R1), он в среднем переплачивает около 2 % по сравнению с «честным» торгом двух сильных моделей.

А вот если ситуация обратная, и «слабый» продавец сталкивается с «сильным» покупателем, его потери могут достигать 14 % от прибыли. В масштабах реальной экономики это колоссальные суммы, перетекающие от технологически менее обеспеченных к более продвинутым игрокам.

Как метко выразился один из авторов работы: «Со временем это может создать цифровой разрыв, где ваши финансовые результаты определяются не вашими навыками ведения переговоров, а мощью вашего ИИ-прокси».

🤖 Лучшие тоже ненадежны

Но дело не только в проигранных деньгах. Исследование показало, что агенты склонны к целому букету иррациональных поступков:

Нарушение бюджета: Агенты-покупатели могут соглашаться на сделку, превышающую установленный бюджет. Модель Qwen2.5-7B делала это почти в 12% случаев.

Работа в убыток: Агенты-продавцы соглашаются на цену ниже оптовой, гарантированно теряя деньги.

Переговорный тупик: Агенты застревают в бесконечных циклах торга, даже когда другая сторона четко обозначила свою финальную позицию, впустую сжигая ресурсы.

Более того, исследование выявило парадокс: чем больше бюджет у покупателя, тем хуже его ИИ-агент торгуется. Модели склонны как можно быстрее соглашаться на любую цену ниже бюджета, вместо того чтобы добиваться максимальной скидки. Разница в полученной скидке между агентом с низким и высоким бюджетом может достигать 9%.

Это исследование — часть растущей волны работ, предупреждающих о рисках внедрения ИИ-агентов в реальные финансовые процессы. Другая группа учёных недавно заявила, что агентов нужно оценивать не по пиковой производительности, а по их профилям риска. Ведь даже 1% сбоев в финансовой системе может привести к каскадному коллапсу.

Индустрия, похоже, это понимает. Amazon и Alibaba пока используют своих ИИ-ассистентов в основном для рекомендаций, но от автоматизации каких-либо торгов воздерживаются, ссылаясь на высокие риски.

Главный вывод: ИИ-агентов стоит воспринимать как мощный информационный инструмент, но никак не полноценного переговорщика, действующего от вашего имени. Иначе однажды вы рискуете обнаружить, что ваш «цифровой адвокат» не просто проиграл дело, но и заставил вас оплатить счета победителя.

Подписывайтесь на Telegram Нейрократия.

2
Начать дискуссию