Как ИИ-разработчик отстаивает свою правоту или ограничения приводят к заблуждениям

Прочитал сегодня наболевшую историю одного разработчика, суть истории вот в чем:

Vibe Coding — это тренд, где ИИ генерирует код быстро и красиво, создавая иллюзию компетентности. Автор написал iOS-приложение за час без знания Swift, вызвав ажиотаж. Автор попробовал сам: ИИ сгенерировал код для OCR-сервиса, который выглядел профессионально, но не работал. При попытке исправить баги ИИ упорно отрицал ошибки в коде, обвиняя API, и долго отстаивал свою правоту. Главная проблема vibe coding — фундаментальное непонимание задачи ИИ и его способность создавать правдоподобные оправдания, что делает отладку такого кода настоящей пыткой. (Оригинал)

Интересно что человек-программист делает точно так же когда убежден в своей правоте несмотря на то что ошибается.

Можно говорить даже не про программистов, а про людей.

Логика ИИ-чатов основана на логике слов(код тоже пишется словами и связан словесной логикой), так что закономерно что так происходит. Человек разумный же обладает всей полнотой данных, у него есть как и слова так и результаты его работы. Обратная связь от мира на его действия не только в виде слов, но и в виде материального продукта. ИИ-чат же пока полагается только на обратную связь из слов. Когда ИИ сможет распознавать и полученный продукт, тогда он сможет находить ошибки в продукте и корректировать их. Сейчас же он может только находить ошибки в словах и корректировать их.

Так что Claude в силу своих ограничений очень крут. Он выходит за рамки своего словесного продукта и предлагает обратить внимание на словесные продукты взаимодействующие с ним(API). При этом реальный продукт по прежнему находится для него в слепой зоне.

Например вместо того чтобы сразу писать код в Claude Code, можно сначала планировать задачу на модели Opus в режиме планирования, а затем выполнять её на модели Sonnet. Обязательно подключать MCP для тестирования кода и приложения. Использовать чат Claude для кода неэффективно, ведь это не его задача. Нет смысла отправлять логи — Claude Code сам проверит и исправит ошибки.

Если возникают проблемы, не стоит жаловаться — нужно правильно выбирать инструменты и подход к выполнению задачи, будь ты ИИ или Человек :)

Спасибо, принимаю!

Как ИИ-разработчик отстаивает свою правоту или ограничения приводят к заблуждениям

Мне пришли такие мысли в ответ:

Из комментариев я понял что такие инструменты уже существуют:

Как итог моего исследования: