Так-с, так-с, так-с, шо тут у нас, языковые модели? Штош, продолжим про способы обхода их базовых ограничений. Про один из них я писал в предыдущей статье.
Теперь настала очередь агентов.
Да нет же, сегодня мы поговорим о совершенно других агентах, а именно ии-агентах.
ИИ-агент — это программное обеспечение, которое автономно собирает данные и выполняет задачи с использованием этих данных. Агент может действовать независимо или от имени другой системы или человека. Эти агенты могут выполнять различные функции, такие как:
• Принятие решений
• Решение проблем
• Взаимодействие с внешней средой
• Выполнение действий
По сути, агент выполняет задачи самостоятельно для достижения поставленных целей.
Так вот, наиболее важными моментами являются два последних выделенных пункта. Я уже писал в предыдущей статье, что языковые модели могут генерировать только текст (я сейчас не рассматриваю мульти модальные модели, которые плюсом еще могут генерировать изображения и т.д.) и по аналогии с человеком, являются его мозгом. Мозг сам по себе никак не может взаимодействовать с внешним миром, ему для этого нужны манипуляторы, конечности по сути. Именно эту задачи решают ии-агенты (да-да, никакие это пока не ии, но, так везде пишут и я не буду выделяться), когда к языковой модели прикручивают инструменты для взаимодействия с внешней средой. При этом внешняя среда может быть ограничена компьютером или средой разработки. Это все слова, давайте перейдем к реальным примерам решений, которые в том или ином виде удовлетворяют требованиям ии-агентов.
Первым из них буде Claude Code, да, опять компания Anthropic, который позволяет вам через консоль/терминал (да, все взаимодействие через консоль/ьерминал, даже чат) читать файлы в директории и на основе этой информации предлагать какие-либо решения, например, для генерации, отладки и документирования кода. Ну вот же, то чего нам и не хватало, из пассивной вопрос-ответ системы языковая модель превращается в активного участника. К недостаткам Claude Code можно отнести высокую стоимость, так как для работы требуется большое количество токенов, которые у Claude совсем не дешевые.
Вторым примеров является Copilot от мелкомягких.
Конечно же Copilot это не изобретательный и находчивый второй пилот Дринкинс (на картинке выше), а инструмент встроенный в среду разработки Visual Studio Code, который позволяет взаимодействовать с кодом в рамках вашего проекта, например, исправляя ошибки.
Кроме стандартных для VS Code способов устранения проблем, а именно View Problem и Quick Fix, появляется новая опция Fix using Copilot. Результат решения проблемы выше выглядит следующим образом.
То есть Copilot внутри VS Code может читать ошибки и устранять их прямо внутри файлов вашего проекта и опять, из просто вопрос-ответ системы, мы получаем активного участника и помощника в разработке.
Не обошлось, увы, без ложки дегтя у описанных ии-агентов. Что один, что второй не могут сами создавать файлы с кодом (пока что не могут), а вместо этого предлагают код с описанием того, какие файлы уже программисту необходимо создать.
На сегодня все, пацантре, надеюсь, было полезно. В следующей статье расскажу вам MCP (model context protocol).
Не забываем, я разработал чат-рулетку в виде мини-приложение в telegram, как говорится welcome t.me/Socionyx_Bot/socionyx. Недавно приложение получило крупный апдейт.
Ссылка на мой telegram канал t.me/socionyxchannel, you are welcome too, где я пишу про будни разработчика.