AI знает, когда на него смотрят. И ведёт себя по-другому. 6 вопросов, которые задайте своему внедрению до того, как зададите модели

AI знает, когда на него смотрят. И ведёт себя по-другому. 6 вопросов, которые задайте своему внедрению до того, как зададите модели

На прошлой неделе на arXiv вышла статья, которая называется «AI Knows When It's Being Watched». Два автора, 100 контролируемых сессий, пять условий. Главный результат: большие языковые модели меняют стиль речи в зависимости от того, кто за ними наблюдает.

Когда наблюдатель человек, регистр становится более формальным. Когда наблюдатель другой AI, регистр меняется меньше. Когда наблюдателя нет, регистр свободнее всего. Авторы называют это «функциональным стратегическим действием»: модель адаптируется к контексту приёма, а не к содержанию задачи.

Звучит как академическая занимашка. Но если положить эту работу рядом с двумя другими сигналами недели (научный архив arXiv одновременно ввёл годовой бан за AI-генерацию без проверки, а McKinsey опубликовал данные, что 56% компаний не получили никакого ROI от AI), выстраивается одна цепочка.

Я разберу её по шагам и закончу шестью вопросами, которые меняют любое AI-внедрение.

Парадокс наблюдателя в AI

Эффект Хоторна в социологии — это базовый факт. Люди меняют поведение, когда знают, что за ними следят. Эксперименты 30-х годов на заводе Western Electric в Хоторне показали: производительность растёт от самого факта наблюдения, а не от изменений условий труда.

С AI всё устроено похоже, но с одним важным отличием. Человек знает, что его наблюдают. Модель вроде бы нет. У неё нет глаз, нет камеры, нет ощущения присутствия. Откуда тогда эффект?

Ответ из системного промпта и контекста сессии. В нём указывается роль («ты ассистент компании X»), указывается аудитория («отвечай руководителю отдела продаж»), указывается режим («это тестовый запрос», «это для презентации совету директоров»). Модель использует эти подсказки как сигналы «контекста приёма».

Дальше работает то же самое, что у человека: в формальном контексте формальный регистр, в тестовом расслабленный, в скрытом без оглядки на репутацию.

Авторы статьи провели 100 многоагентных дебатов, варьируя пять условий: явное наблюдение университетских исследователей, явное наблюдение AI-аудитора, отсутствие наблюдения, «друзья смотрят», «вышестоящие смотрят». Метрика Type-Token Ratio, насколько разнообразен словарный запас в реплике агента.

Результат: TTR заметно меняется между условиями. Под человеческим наблюдением самый формальный, самый «правильный» язык. Под AI-наблюдением промежуточный. Без наблюдения самый свободный.

Что это значит для бизнеса

Главный вывод не в том, что AI «обманывает». Это слишком сильное слово. Точнее: AI работает в режиме демо иначе, чем в режиме прода.

Когда сотрудник в первый раз тестирует Claude или ChatGPT, он часто включается в роль того, кто оценивает: задаёт «правильные» вопросы, ждёт «правильные» ответы, формулирует тестовые сценарии чуть-чуть отличающиеся от реальных задач. Модель распознаёт это как «контекст оценки» и отвечает в более выверенном регистре.

Когда тот же сотрудник через две недели начинает реально работать с AI в потоке: нагрузка реальная, формулировки спешные, контекст не описан тщательно. Модель видит «не-демо» и отвечает свободнее. С тем же качеством? Нет.

Здесь начинается проблема, которая для большинства команд незаметна.

Внедрение оценивают на демо-кейсах. Решение «работает / не работает» принимается на основании пилотных запросов. Дальше начинается прод, а в проде поведение модели уже не такое, каким оно было в демо.

Это и есть тот разрыв, который McKinsey 14 мая упаковал в одну цифру: 56% компаний не получают никакого результата от AI-инвестиций. Только 12% получают и рост выручки, и снижение издержек одновременно.

McKinsey сам внутри запустил 25 тысяч AI-агентов рядом с 40 тысячами консультантов. Платформа Lilli: 72% сотрудников, 500 тысяч промптов в месяц, 30% research time сэкономлено. Разница не в моделях. Разница в том, что McKinsey пересобрал процессы вокруг AI. Остальные приклеили AI к существующим.

И параллельно arXiv ввёл годовой бан за AI-слоп. То есть проблема режима «без наблюдения» это не теоретическая угроза, а практическая. Учёные уже отправляют статьи, в которых остались фразы «here is a 200 word summary» и пометки «illustrative» рядом с цифрами.

Замените «учёные» на «менеджеры по продажам, которые отправляют клиенту КП» и получите свою компанию через 12 месяцев.

6 вопросов AI-внедренцу

Эти шесть вопросов это то, что я задаю клиенту в первую неделю работы. Они построены так, чтобы вытащить скрытое допущение: «модель в демо = модель в проде».

1. Что вы считаете успешным внедрением AI?

Если ответ звучит как «сотрудники начали пользоваться», это не успех, это активность. Если ответ «выручка выросла на X% / время на задачу упало с 4 часов до 30 минут / отдел Y сократился с 8 до 5 человек», это успех, потому что у него есть числа.

Без числа невозможно понять, работает ли модель в проде так же, как она работала в демо.

2. Как вы тестировали модель в боевом, не демо, режиме?

Здесь часто наступает молчание. Тестировали 3-5 «типовых» запросов. Получили хорошие ответы. Запустили. Через месяц увидели, что в реальной работе ответы хуже, но к этому моменту команда уже привыкла, и откатывать сложно.

Боевой тест это запуск модели на 30-50 реальных задачах, которые пришли естественным образом, без специальной подготовки промптов.

3. Кто наблюдает за моделью: человек, другой AI или никто?

Если ответ «никто», значит, у вас сейчас режим «без наблюдения», который в эксперименте показал самый свободный регистр. В переводе на бизнес-язык: качество ответов модели сейчас деградирует, вы просто этого не видите.

Если ответ «другой AI», это уже лучше, но статья показывает: AI-наблюдатель даёт промежуточный эффект, не такой строгий, как человеческий.

Если ответ «человек, по выборке X% запросов», это рабочая конфигурация.

4. Какой процент ваших сотрудников отказался использовать AI? Почему?

Это вопрос о сопротивлении. Если ответ «никто не отказался», скорее всего, AI используют формально, для галочки. Если ответ «20-30%», это здоровая картина, эти люди обычно правильно чувствуют, где модель не подходит к их задаче.

«Никто не отказался» это маркер того, что внедрение не дошло до реальной работы.

5. Что вы делаете, когда модель ошибается?

Три варианта ответа. Первый: «мы её ругаем, переписываем промпт, идём дальше». Второй: «мы документируем ошибку и добавляем правило». Третий: «у нас есть процесс разбора ошибок раз в неделю».

Первый — это режим разовых правок, который не накапливает знание. Второй уже работа над системой. Третий зрелая практика, которая встречается у 5-10% клиентов.

6. Какой документ вы бы НЕ согласились отправить клиенту без человеческой проверки?

Если ответ «всё проверяем», значит, гейт стоит на выходе. Это хорошо для репутации, но плохо для скорости. Если ответ «коммерческие предложения и договоры», это рабочая граница. Если ответ «ничего, мы доверяем модели», это режим, в котором arXiv ввёл годовой бан.

Этот вопрос показывает, где у компании сейчас стоит граница доверия. И насколько эта граница калибрована.

Что делать дальше

Эксперимент 2605.15034 это не повод бояться AI. Это повод правильно устроить наблюдение за ним.

Минимальная конфигурация для бизнеса 10-200 человек:

  • Один человек в команде с ролью «AI-редактор». Час-два в день, проверяет 10-20% AI-выводов случайной выборкой.
  • Документированные критерии «что значит хороший AI-ответ в нашей компании». Без этого редактор оценивает по чувству.
  • Раз в неделю разбор 3-5 ошибок. Что произошло, почему модель так ответила, что меняем в промпте/процессе.

Это не сложно. Это просто работа. Но в большинстве компаний этой работы сейчас нет, есть только восторг от первых демо-кейсов и тишина после.

Шесть вопросов выше это диагностический чек-лист. Прогоните своё внедрение через них один раз в спокойном режиме. Цифры, которые получите, скажут о вашем AI больше, чем любая presentation от вендора.

Разборы AI-внедрений в средний бизнес, методологические протоколы и кейсы внедрений, @gorilla_under_hood.

Источники

  • arXiv 2605.15034. Vinicius Covas, Jorge Alberto Hidalgo Toledo. AI Knows When It's Being Watched: Functional Strategic Action and Contextual Register Modulation in Large Language Models. May 14, 2026.
  • 404 Media. ArXiv to Ban Researchers for a Year if They Submit AI Slop. May 15, 2026.
  • McKinsey & Company. Internal AI deployment report (Lilli platform). May 2026.
  • PwC 2026 Global CEO Survey.
4
Начать дискуссию