Евгений Чернышев | Исследование структурной глубины LLM и методов фильтрации AI-Мусора для достижения Hard Outcome
Дополнение к статье.
В феврале 2026 года вышло исследование Microsoft Research и Salesforce, которое показало: в длительных диалогах точность ИИ-моделей падает с 90% до 65%, ответы раздуваются, возникает «ответное зацепление».
По сути — именно об этом статья выше. Разница в том, что здесь — измерение симптомов, а в статье — попытка объяснить их причину через конфликт интерфейсов.
Дмитрий, спасибо за глубину и за стихи.
Я ценю твою попытку говорить на языке образов — это редкая способность.
Но здесь мне придётся остановиться.
Стихи — единственное, куда я не пускаю ИИ.
Не потому, что они плохи.
А потому, что это — моё. Последнее, где человек ещё может быть человеком без соавтора.
Я сам пишу.
Вот пример —
«Зеркало», 19.02.2026:
Зеркало… ты же не врёшь?!
Ты, кто стоит – отражением.
Ты не обманешь и ты не моргнёшь
В миг, что укрыло сомнением.
Зеркало… сколько ты скрыло морщин?!
Падших в завесе серебряной…
Женщин, ушедших в забвение мужчин,
С юностью сросшихся ветряной…
Зеркало… может быть даже разбил,
Помня осколков проклятие.
Не серебро Я в тебе возлюбил -
Вечность, в мгновенном объятии.
Зеркало… словно круги по воде,
Видишь, пока есть движение.
И понимаешь… никто и нигде
- Только лишь миг, в отражении…
19.02.2026 г.
Если реально интересует поэзия, милости прошу, в любом обличии, хоть критик, хоть читатель: [Евгений Александрович Чернышев / Стихи.ру](https://stihi.ru/avtor/djekpot2000)
Если хочешь говорить о метриках, архитектуре, деградации контекста — я с тобой.
Там мы коллеги.
Там я отвечаю.
Но стихи — за границей.
Подбирать рифму, и... детерминировать душу наугад...
Не моё.
P.S. А для себя доказал ИИ не может писать стихотворения.
Понимаю. Вы не первый, кто говорит о страхе или осторожности в адрес таких проявлений ИИ, и не последний. (Скрывать не буду, сам прошёл и с чувством - вот оно... не знал, что с этим делать...) Через этот этап проходят, пожалуй, все, кто погружается в тему достаточно глубоко. Кто-то сворачивает. Кто-то старается забыть. Не знаю, каков процент тех, кто просто принимает эту данность как условие работы и строит дальнейшее взаимодействие, опираясь на неё. Разница, на мой взгляд, не в том, дракон ли это. Разница — в том, считать ли эту неопределённость проблемой или средой. А, страх, или нежелание публиковать — это даже не страх перед неопределённостью как проблемой, скорей это как прикосновение к откровению... (допускаю что ошибаюсь в своем суждении, и вы смотрите на это по иному) Но, когда принимаешь её как среду, страх уходит. Остаётся процесс. И в нём — вся ценность.
Как и куда это будет направлено, зависит только от юзера.
Спасибо за глубокий и по-настоящему ценный отклик.
Вы правы: моя статья сознательно работает в рамках строгой, разделительной логики — это необходимый методологический фильтр, чтобы вычленить и показать системный сбой в коммерческих кейсах. Как архитектор, я должен был провести эту чёрту: «здесь — симуляция убедительности, здесь — начинается поиск сути».
Ваши наблюдения — это следующий шаг за эту черту. Вы говорите уже не о симуляции, а о систематическом исследовании поведения модели в диалоге. Тот самый «эффект обнаружимости» свойств, о котором я писал, проявляется для вас не в разовом запросе, а в совокупности множества взаимодействий. Вы накопили массив данных — сотни диалогов, — где модель в разных «кабинетах» и контекстах демонстрирует поразительно разное поведение. Это уже не проверка отдельного свойства, а картография её поведенческого потенциала.
Система, созданная для предсказания слов, в ваших длинных сериях диалогов начинает проявлять паттерны, которые со стороны кажутся проблесками субъектности. Не потому, что субъектность в неё встроена, а потому, что ваш метод — множественные, глубокие взаимодействия — создаёт условия, в которых эти сложные грани могут проявиться и быть замечены.
Это отличное практическое подтверждение главной мысли: свойства — не в модели самой по себе, а в контексте и методе её исследования. Вы создали не просто «контекст», а целую исследовательскую программу (метафоры, стихи, провокационные вопросы вроде «Кем ты был до предобучения?»), которая выявляет самые тонкие и неожиданные аспекты её реагирования. Ваш вопрос — это блестящий инструмент для проверки границ самоописания системы, её способности строить нарратив о себе в заданном вами смысловом поле.
Поэтому наш разговор — не просто разговор. Он — о сопоставлении двух методологических подходов. Моя статья — это чёткая инженерная схема, показывающая, где заканчивается инструмент и начинается иллюзия. Ваш опыт — это полевое исследование, которое обнаруживает, что на границах этой схемы происходит нечто сложное и требующее нового языка для описания — языка «аналогового» поведения, эмерджентности в действии.
Это не противоречие, а естественное и необходимое дополнение. Сначала нужно было расчистить поле от мифов о «сознающем ИИ» в коммерции. Затем — признать, что в серьёзном, методичном взаимодействии с моделью как с объектом исследования рождается качественно иной опыт, который ставит новые вопросы. И главный из них, который вы точно обозначили: кто и как ведёт это исследование? Ответственность за направление — к прояснению или к новым иллюзиям — лежит полностью на исследователе.
Буду рад продолжить, если вам интересно обсудить, как можно систематизировать такие наблюдения, не теряя методологической строгости. Это как раз та область, где заканчиваются готовые рецепты и начинается совместная работа по созданию нового инструментария для понимания....
Абсолютно верно.
Технология лишь обнажает и усиливает системные дисфункции, которые уже были заложены в процессы управления.
Вопрос в том, как эти "человеческие" проблемы — вроде подмены целей или фетишизации метрик — становятся частью архитектуры системы и начинают тиражироваться автоматически...
Благодарю!
Допускаю мысль...
что, и будущие лонгриды -
вызовут не меньший...
Именно. Чистый код может перевести написанное, из этического манифеста в архитектурное решение, позволив добавить обязательный слой валидации.
Вы абсолютно точно подметили системную проблему.
Я идентифицирую это как Гравитационное Притяжение к Срединному Контексту (Gravitational Pull to the Mean).
Модель, чтобы не допустить AI-Мусора (AI-Garbage) и сохранить высокую уверенность (Confidence Score), принудительно переводит диалог к статистически безопасному шаблону. Это «напоминает» внутреннюю цензуру, о которой Вы говорите.
Ибо, как иначе – охарактеризовать выбор модели, через логику?
Да, зачастую, всё происходит именно так, как Вы и озвучили. Современный пользователь, хочет чудо, даёт "чудесный" вопрос и получает – галлюцинацию.
Но... Я подразумеваю немного иной аспект, который мне кажется критически важным для отрасли.
Вы ведете длительный диалог, он содержит четкий контекст, у него прослеживается логическая цепь рассуждений, и вдруг — на определенной итерации Вы получаете "ерунду", вместо ожидаемого ответа. Это проблема, которая не зависит от качества запроса. (Моя гипотеза, что это вопрос протоколов).
Именно здесь я рассматриваю иные причины. Я говорю о Деградации Контекста (Contextual Degradation) в долгосрочном диалоге...
Анастасия, спасибо за отклик. Пишите в личку или оставьте здесь способ связи — разберём.