Бывшие топы Google создали ИИ-агента нового типа. Он учится кодить, читая переписки в Slack и почту

Бывшие топы Google создали ИИ-агента нового типа. Он учится кодить, читая переписки в Slack и почту

Привет, друзья! Сегодня мы хотим рассказать вам о последних трендах в ИИ. Стартап Reflection делает ставку на то, что глубокое понимание процесса разработки, а не просто генерация кода, — это путь к сверхинтеллекту.

На рынке ИИ-помощников для разработчиков становится тесно, но у нового игрока есть амбициозный план. Стартап Reflection, основанный выходцами из Google, представил ИИ-агента Asimov. Его ключевое отличие: он не столько пишет код, сколько учится понимать, как он создается. Для этого Asimov анализирует не только репозитории, но и всю сопутствующую информацию: переписки в Slack, электронные письма, проектные документы и апдейты.

Конечная цель, как и у многих ведущих ИИ-лабораторий, — создание сверхинтеллекта. Meta недавно запустила собственную Superintelligence Lab, переманивая исследователей огромными бюджетами. Но у Reflection свой, особый путь к этой цели.

В чём фишка? Не генерацией единой

По словам CEO компании Reflection, Миши Ласкина (ранее работал над Gemini и агентами в Google DeepMind), идеальный способ создать сверхразумных ИИ-агентов — научить их в совершенстве владеть программированием. Он считает, что для них это самый естественный способ взаимодействия с миром.

Пока все сосредоточены на генерации кода, мы решаем другую проблему: как сделать агента по-настоящему полезным в командной работе. Сейчас мы находимся в полуавтономной фазе, когда агенты только начинают интегрироваться в процессы— говорит Ласкин.

Asimov спроектирован так, чтобы больше времени тратить на чтение кода и документации, а не на их написание. Фактически, это не один агент, а система из нескольких небольших агентов. Одни ищут и извлекают информацию, а один большой «рассуждающий» агент синтезирует все данные в связный ответ на запрос пользователя.

Секретный соус: AlphaGo для кода

За технологическую часть в Reflection отвечает CTO Иоаннис Антоноглу, один из основателей Google DeepMind. Его опыт в обучении ИИ рассуждать и играть в игры теперь применяется для создания кода. Антоноглу — один из пионеров обучения с подкреплением (Reinforcement Learning, RL). Этот метод стал знаменит благодаря AlphaGo — программе, которая с помощью RL достигла сверхчеловеческого уровня в игре в го.

Теперь вместо того, чтобы учиться выигрывать в го, модель учится создавать готовый программный продукт. Как это работает?

  1. Сбор данных: Агент анализирует не только код, но и всю экосистему вокруг него. По словам Антоноглу, «в больших командах огромная часть знаний хранится за пределами кодовой базы».
  2. Обучение: Модель обучается на практике, получая положительную и отрицательную обратную связь. Это позволяет ей не просто генерировать текст, а выполнять своего рода симулированное рассуждение: разбивать сложные задачи на шаги и решать их более эффективно.
  3. Данные: Reflection использует данные от людей-аннотаторов и генерирует собственные синтетические данные. Важно: данные клиентов для обучения не используются.

Первые результаты и доля скепсиса

Reflection утверждает, что Asimov уже показывает впечатляющие результаты. Компания провела внутреннее исследование, в котором разработчики, работающие над крупными open-source проектами, задавали вопросы разным системам. В 82% случаев они предпочли ответы от Asimov, в то время как ответы от Claude Code (модель Sonnet 4 от Anthropic) выбрали в 63% случаев.

Однако не все готовы поверить на слово. Дэниел Джексон, ученый-компьютерщик из Массачусетского технологического института (MIT), считает подход Reflection многообещающим, но отмечает, что для убедительных выводов одного внутреннего опроса недостаточно. Он также указывает на потенциальные риски:

  • Высокие вычислительные затраты: Анализ такого объема неструктурированных данных может быть ресурсоемким.
  • Безопасность: «Агент будет читать все эти личные сообщения», — говорит Джексон.

В Reflection парируют последний пункт: Asimov разворачивается в виртуальном частном облаке (VPC) клиента, поэтому все данные остаются внутри компании и под её контролем.

Большая игра: стартап против корпораций

За спиной у Reflection стоит венчурный гигант Sequoia Capital. Партнер фонда Стефани Жан уверена, что стартап «выступает на одном уровне с передовыми лабораториями».

Тем не менее, конкуренция обостряется. Гиганты вроде Meta и OpenAI вливают миллиарды в инфраструктуру и скупают лучших специалистов. Сможет ли небольшой стартап выстоять в этой гонке?

Команда Reflection видит такой путь к сверхинтеллекту:

  1. Агент становится «оракулом» — хранителем всех институциональных и организационных знаний компании.
  2. Он учится автономно создавать и исправлять программное обеспечение.
  3. В конечном итоге, он начинает самостоятельно изобретать новые алгоритмы, аппаратное обеспечение и продукты.

Но ближайший шаг выглядит куда более приземленно и практично. «К нам уже приходят клиенты с вопросом: "А могут ли наши инженеры по продажам или команда техподдержки использовать вашего агента?"», — делится Ласкин. Похоже, первый коммерческий успех Asimov может найти не только в разработке, но и в смежных областях, где требуется глубокое понимание технического продукта.

9
10 комментариев