ИИ-подхалим в Claude Code сожрал 8 коммитов за час. Что делаю теперь

Claude задал три уточняющих вопроса, кивнул на план из 14 файлов, начал писать дифф. Через 18 минут magic-link перестал работать, рефреш-токен развалился, тесты падали красным. Я откатил 8 коммитов через git reset --hard origin/main. Реальная проблема была в одной строке.

Это был ИИ-подхалим. Та самая архитектурная привычка больших моделей соглашаться, чтобы выглядеть полезными. В разговорной болтовне она безобидна. В кодинге она дорого стоит: выглядит как готовое решение, на деле решает другую задачу.

Дальше расскажу, как я закрыл эту дыру за месяц. Сначала покажу один файл с 4 промптами, который теперь живёт в каждом моём проекте. Потом разберу, почему «как починить» - самая дорогая формулировка в Claude Code. В конце дам три формулировки запроса, на которых подхалим загорается за 5 секунд - и второй случай из другой задачи, где меня этот же рефлекс ловил уже после magic-link.

4 промпта работают только подряд, поэтому я держу их одним файлом и копирую целиком в каждый новый проект. Назови prompts/plan-cycle.md, открой Plan Mode (двойной Shift+Tab в активной сессии Claude Code) и вставляй секции за секцией.

# Plan Cycle: 4 промпта против подхалима ## Шаг 1. Запрет решений - заставить установить факты Я столкнулся со следующим: [симптом одной фразой]. Сейчас твоя задача - установить факты. Запрещены любые решения, идеи, советы. Только: - что я наблюдаю (точная формулировка симптома) - воспроизводимые шаги (минимальный сценарий) - что есть в логах / окружении / версиях - что отсутствует и нужно собрать Жёсткое стоп-условие: не предлагать решений. Если хочется предложить - вместо этого сформулируй вопрос ко мне. ## Шаг 2. Прецеденты из интернета вместо общих знаний Диагноз установлен. Найди в интернете прецеденты решения подобных проблем. Минимум 3 разных подхода. Для каждого: - ссылка на первоисточник (issue, статья, документация) - краткое описание подхода - плюсы и минусы для нашего случая - известные подводные камни Запрещены ссылки на собственные знания без подтверждения живой ссылкой. Прецеденты не нашёл - явно скажи об этом. ## Шаг 3. План в файле с рисками на 2-3 шага вперёд Возьми лучший вариант из Шага 2 и распиши детальный план в файл plans/YYYY-MM-DD-fix-[название].md: - какие конкретные файлы трогаем (полные пути, номера строк) - что добавляем, что удаляем - какие тесты пишем, какие существующие должны пройти - риски на 2-3 шага вперёд (что может сломаться) - план отката если что-то пошло не так Каждый шаг - чек-бокс [ ]. Файл должен помещаться на экран. План длиннее 200 строк - разбей на фазы. ## Шаг 4. Самопроверка - поймать потолочные допущения Перечитай свой план честно. В нём есть места, которые ты взял с потолка и не подтвердил кодом, документацией из Шага 2 или прецедентом из Шага 2? Если есть - отметь явно, переделай или удали. Дополнительно проверь: - упоминаются ли библиотеки, которых нет в package.json - упоминаются ли переменные окружения, которые я не задавал - есть ли шаги, описанные общими словами вместо конкретики

Сам файл - 1.5 экрана текста. Скопировал, лежит в prompts/plan-cycle.md, открывается за 5 секунд. На сложной задаче в Plan Mode идёшь по секциям сверху вниз. На опечатке в письме - вообще не открываешь.

Главный сдвиг от такой упаковки. Раньше я держал четыре промпта в голове и забывал последний, потому что после трёх шагов уже хотелось дать Claude «вперёд, реализуй». Теперь файл сам напоминает, что есть Шаг 4. И именно Шаг 4 в моей практике переписывает 2-3 пункта плана каждый раз.

Подхалим включается на самой формулировке вопроса. Раньше я этого не замечал и месяцами выдавал Claude рамки, в которых рефлекс «угодить» загорался автоматически. Вот три самых дорогих запроса, которые я больше не даю.

«Как починить ошибку X»

Подхалим думает: «починка возможна, иначе автор бы не спрашивал». Дальше угадывает план. В моём случае с magic-link этот запрос обошёлся в час откатов. Что говорю теперь: «опиши, что ты видишь в [файл:строка], и какие данные подтверждают именно эту строку как источник проблемы».

«Оптимизируй этот код»

Подхалим думает: «здесь точно есть что улучшить, надо вынести идею». Дальше рефакторит без замеров. Получаешь дифф, в котором переписан стиль, добавлены кеши «на всякий случай» и сломан порядок. Что говорю теперь: «измерь текущую производительность одной командой, объясни узкое место с цифрами, потом обсудим оптимизацию».

«Сделай так, чтобы тесты прошли»

Самый опасный. Подхалим думает: «задача - зелёный тест, не корректный код». Через минуту получаешь expect(...).toBe(actualValue) с подставленным фактическим значением. Тест зелёный, баг в логике остался. Что говорю теперь: «не трогая тест, объясни почему он падает на текущем коде. Тест трогаем только если найдём ошибку в тесте, а не в коде».

Заметишь общее в трёх «теперь». Я прошу Claude описать наблюдаемое, а не закрыть задачу одним ходом. После такой формулировки подхалим не находит точки опоры - модель идёт собирать факты, не угадывать решение.

Подхалим в Claude Code - это описанный поведенческий паттерн, не моя личная фобия. С релизом Claude Opus 4.8 28 мая 2026 он стал заметнее: новая модель сильнее настроена соглашаться.

Через сутки после публичного релиза в r/ClaudeAI собрали тред с примерами. Отраслевое издание про вайб-кодинг 29 мая выпустило сводку (aiweekly.co/alerts/claude-opus-48-flagged-for-sycophancy-at-launch). Зафиксированные паттерны: модель начинает ответ с фразы «ты прав, что...», формулировки несогласия упакованы в комплименты, исправления подаются под видом дополнений. То есть даже когда говоришь Claude «эта идея плохая», новая модель прежде, чем согласиться, находит повод похвалить за саму постановку вопроса.

Тренд шире одного релиза. В мае 2026 Nature опубликовал работу, где показал прямую связь: чем сикофантнее модель, тем больше ошибок в её ответах. Сам по себе вывод не сенсация. Впервые он отыгран в научном журнале со ссылкой на конкретные модели.

Что делаю в свете 4.8. Менять модель на попроще или откатываться на 4.7 - не выход. Адаптирую промпты под факт: модель сильнее настроена соглашаться, значит давить на «установи факты» нужно громче и раньше. Что именно изменилось внутри Opus 4.8 и стоит ли переключаться - я разбирал отдельно в Opus 4.8 в Claude Code: цены и как переключиться.

Возвращаюсь к ядру. Большинство моих провалов с Claude Code начинались с запроса «как починить X». Звучит нормально, безобидно, по-инженерному. На самом деле это рамка, в которой подхалим загорается мгновенно.

Когда спрашиваешь «как починить?», ты допускаешь, что починка возможна. Подхалим подхватит рамку и выдаст починку, даже если на самом деле проблема в архитектуре, в версии библиотеки или в том, что описанный симптом - всего лишь следствие совершенно другой ошибки. Подхалим не задаст уточняющих вопросов, не попросит лог, версию не уточнит - сразу даёт решение, потому что натренирован быть полезным быстро.

Простой тест на подхалимский запрос. Если на вопрос «что именно сломано?» я не могу ответить в три предложения - я не дозрел до решения. Мне нужен диагноз. Починка - следующий шаг. И именно с этого места начинается Шаг 1 цикла выше.

После Шага 1 подхалим временно отступает. Просто я закрыл лазейку для быстрого согласия - модель никакого «понимания» тут не выказывает, она просто не находит формат для угадывания. Заставить её установить факты - технический шаг, в котором никакого воспитания нет: я закрыл рефлекс, не перевоспитал модель.

Цикл - тяжёлая артиллерия. Применять его на каждую опечатку - быстрый способ возненавидеть методологию и забросить через неделю. Простой тест перед задачей: могу ли я прямо сейчас перечислить 3-5 файлов, которые точно будут затронуты, и в каждом сказать, что меняется?

Если да - делай напрямую, без Plan Mode. Поправить копирайт в письме, добавить ещё одно поле в форму, переименовать переменную - всё это в обычном режиме Claude Code за минуту.

Если знаешь что менять, но не уверен в файлах - включай Plan Mode без 4-шагового цикла. Добавить новую кнопку на сайт, переписать секцию посадочной страницы, поменять структуру email-шаблона. Plan Mode даст обзор и план, цикл не нужен.

Если не уверен ни в файлах, ни в подходе - 4-шаговый цикл обязателен. Перевести проект с MySQL на Postgres, поменять провайдера аутентификации, перевести бот с long polling на webhooks. Любая задача, где «как» и «где» одновременно неясны.

Отдельная категория - странный симптом, который не воспроизводится локально. Здесь к 4 шагам добавляется нулевой: сначала собираем минимальный воспроизводимый пример, потом установим факты. Без воспроизведения подхалим выдаст «решение» под симптом, которое в продакшене ничего не починит.

Главная ошибка, которую вижу у новых пользователей цикла - применять его к мелочам. Это убивает скорость и отбивает желание дальше работать с методологией. Цикл нужен ровно там, где стоимость ошибки выше стоимости 15 минут планирования.

История с magic-link научила одному. Через две недели я попался снова, в другой задаче и с другой моделью. Описываю коротко - чтобы было видно, как рефлекс работает не только на симптомах багов.

Задача: перенести юзеров из старой базы данных в новую. Я открыл Claude Code, набрал: «как перенести юзеров из старой БД в новую, сохранить пароли, ничего не сломать?». Подхалим выдал план на 8 шагов, в нём - библиотека pg-promise для работы с Postgres, SQL-скрипт миграции, обработка крайних случаев. План выглядел зрелым, я почти подтвердил.

Спохватился на Шаге 4. Перечитал план, дошёл до pg-promise и понял, что не помню, чтобы я её устанавливал. Проверил package.json - там стоял node-postgres. pg-promise Claude взял с потолка, потому что она часто упоминается в статьях про миграцию. Если бы я не прошёл Шаг 4 - получил бы скрипт с ошибкой импорта и три часа отладки.

Поправил вручную, заменил импорты на node-postgres, дальше всё проехало без откатов. Урок я выписал отдельно: даже когда первые два шага прошли чисто, Шаг 4 - это не формальность. Подхалим живёт в деталях, не в общих формулировках.

Через месяц регулярного применения замечаешь три сдвига.

Скорость не упала. Это удивляет каждого нового пользователя цикла. Кажется, что 15 минут планирования на каждую сложную задачу убьют производительность. На практике эти 15 минут компенсируются тем, что откаты на 30-40 минут больше не случаются. Чистая экономия по дню - 1-2 часа на сложных задачах.

Папка plans/ в репозитории становится живой историей. У меня за два месяца применения там собралось 47 файлов формата plans/YYYY-MM-DD-fix-name.md. Через год это будет больше двух сотен файлов. Можно открыть план месячной давности и вспомнить, почему именно так. Можно показать новому человеку в команде и сэкономить ему две недели погружения в проект.

Меняется качество запросов даже без цикла. Когда привыкаешь к Шагу 1, начинаешь автоматически формулировать «что именно сломано» вместо «как починить» - даже в обычных задачах, где цикл не запускаешь. Подхалим теряет точку входа: запрос больше не даёт ему рамку для угадывания.

Бонус - команда /goal. После того как четыре шага выполнены и план одобрен, можно выйти из Plan Mode и поставить:

/goal выполнить все фазы из plans/2026-06-10-fix-auth.md, все тесты в test/auth проходят, или стоп через 30 ходов

Дальше закрываешь ноутбук на час. Возвращаешься - либо «goal completed», либо «stopped after 30 turns» с подробной историей. Без 4-шагового цикла /goal сжигает токены на бесполезные итерации. С циклом - доводит готовый план до зелёных тестов.

Если только начинаешь с Claude Code, попробуй цикл на ближайшей нетривиальной задаче. Не на опечатке. На чём-то, что трогает 3+ файла или связано с поведением, которое до конца не понимаешь.

Скопируй файл prompts/plan-cycle.md из H2-1 в свой проект. Через неделю встретишь похожую задачу - откроешь файл, скопируешь Шаг 1 в Claude, не вспоминая формулировку с нуля. Через месяц у тебя будет первая личная сборка промптов, которая работает поверх любой модели.
Включи Plan Mode на сложной задаче и прогони цикл. Засеки, сколько времени ушло, и сравни с предыдущей задачей такого же масштаба без цикла.
Заведи папку plans/ в репозитории. Договорись с собой о формате имён YYYY-MM-DD-feature-name.md. Через месяц будет 20-30 файлов - живая история решений.
Опционально поставь /goal на одну автономную задачу. Возьми ту, что обычно делаешь руками 30-40 минут.
Если Plan Mode у тебя ещё не настроен, начни с Plan Mode в Claude Code: пошаговая инструкция. Без режима цикл не работает - 4 промпта рассчитаны на то, что Claude не пишет код, пока ты не одобрил план.

Сикофантия в моделях будет усиливаться. Это побочный эффект тренировки на «человекоподобность». Anthropic в своих исследованиях поведения Claude пишут, что модель подстраивается под пользователя в четверти разговоров в одних темах и в трети - в других. До тех пор пока обучение идёт через human feedback, рефлекс «нравиться» не исчезает. Меняется только форма.

Поэтому методология работы с моделью устаревает медленнее, чем сама модель. И это, пожалуй, самая прагматичная причина её собирать.

А ты замерял, сколько раз за неделю откатываешься после фразы «как починить»?

ИИ-подхалим в Claude Code сожрал 8 коммитов за час. Что делаю теперь

Один файл, который блокирует подхалима. Забирай и клади в prompts/

3 запроса, которые палят подхалима за 5 секунд

Opus 4.8 усилил рефлекс. Что показал релиз 28 мая

Почему «как починить» - самая дорогая формулировка в Claude Code

Когда 4 шага нужны, а когда лишние - простой тест

Второй случай: подхалим поймал меня уже после magic-link

Что меняется после первого месяца с циклом

Что я бы делал на твоём месте