Бывшие топы Google создали ИИ-агента нового типа. Он учится кодить, читая переписки в Slack и почту
Привет, друзья! Сегодня мы хотим рассказать вам о последних трендах в ИИ. Стартап Reflection делает ставку на то, что глубокое понимание процесса разработки, а не просто генерация кода, — это путь к сверхинтеллекту.
На рынке ИИ-помощников для разработчиков становится тесно, но у нового игрока есть амбициозный план. Стартап Reflection, основанный выходцами из Google, представил ИИ-агента Asimov. Его ключевое отличие: он не столько пишет код, сколько учится понимать, как он создается. Для этого Asimov анализирует не только репозитории, но и всю сопутствующую информацию: переписки в Slack, электронные письма, проектные документы и апдейты.
Конечная цель, как и у многих ведущих ИИ-лабораторий, — создание сверхинтеллекта. Meta недавно запустила собственную Superintelligence Lab, переманивая исследователей огромными бюджетами. Но у Reflection свой, особый путь к этой цели.
В чём фишка? Не генерацией единой
По словам CEO компании Reflection, Миши Ласкина (ранее работал над Gemini и агентами в Google DeepMind), идеальный способ создать сверхразумных ИИ-агентов — научить их в совершенстве владеть программированием. Он считает, что для них это самый естественный способ взаимодействия с миром.
Пока все сосредоточены на генерации кода, мы решаем другую проблему: как сделать агента по-настоящему полезным в командной работе. Сейчас мы находимся в полуавтономной фазе, когда агенты только начинают интегрироваться в процессы— говорит Ласкин.
Asimov спроектирован так, чтобы больше времени тратить на чтение кода и документации, а не на их написание. Фактически, это не один агент, а система из нескольких небольших агентов. Одни ищут и извлекают информацию, а один большой «рассуждающий» агент синтезирует все данные в связный ответ на запрос пользователя.
Секретный соус: AlphaGo для кода
За технологическую часть в Reflection отвечает CTO Иоаннис Антоноглу, один из основателей Google DeepMind. Его опыт в обучении ИИ рассуждать и играть в игры теперь применяется для создания кода. Антоноглу — один из пионеров обучения с подкреплением (Reinforcement Learning, RL). Этот метод стал знаменит благодаря AlphaGo — программе, которая с помощью RL достигла сверхчеловеческого уровня в игре в го.
Теперь вместо того, чтобы учиться выигрывать в го, модель учится создавать готовый программный продукт. Как это работает?
- Сбор данных: Агент анализирует не только код, но и всю экосистему вокруг него. По словам Антоноглу, «в больших командах огромная часть знаний хранится за пределами кодовой базы».
- Обучение: Модель обучается на практике, получая положительную и отрицательную обратную связь. Это позволяет ей не просто генерировать текст, а выполнять своего рода симулированное рассуждение: разбивать сложные задачи на шаги и решать их более эффективно.
- Данные: Reflection использует данные от людей-аннотаторов и генерирует собственные синтетические данные. Важно: данные клиентов для обучения не используются.
Первые результаты и доля скепсиса
Reflection утверждает, что Asimov уже показывает впечатляющие результаты. Компания провела внутреннее исследование, в котором разработчики, работающие над крупными open-source проектами, задавали вопросы разным системам. В 82% случаев они предпочли ответы от Asimov, в то время как ответы от Claude Code (модель Sonnet 4 от Anthropic) выбрали в 63% случаев.
Однако не все готовы поверить на слово. Дэниел Джексон, ученый-компьютерщик из Массачусетского технологического института (MIT), считает подход Reflection многообещающим, но отмечает, что для убедительных выводов одного внутреннего опроса недостаточно. Он также указывает на потенциальные риски:
- Высокие вычислительные затраты: Анализ такого объема неструктурированных данных может быть ресурсоемким.
- Безопасность: «Агент будет читать все эти личные сообщения», — говорит Джексон.
В Reflection парируют последний пункт: Asimov разворачивается в виртуальном частном облаке (VPC) клиента, поэтому все данные остаются внутри компании и под её контролем.
Большая игра: стартап против корпораций
За спиной у Reflection стоит венчурный гигант Sequoia Capital. Партнер фонда Стефани Жан уверена, что стартап «выступает на одном уровне с передовыми лабораториями».
Тем не менее, конкуренция обостряется. Гиганты вроде Meta и OpenAI вливают миллиарды в инфраструктуру и скупают лучших специалистов. Сможет ли небольшой стартап выстоять в этой гонке?
Команда Reflection видит такой путь к сверхинтеллекту:
- Агент становится «оракулом» — хранителем всех институциональных и организационных знаний компании.
- Он учится автономно создавать и исправлять программное обеспечение.
- В конечном итоге, он начинает самостоятельно изобретать новые алгоритмы, аппаратное обеспечение и продукты.
Но ближайший шаг выглядит куда более приземленно и практично. «К нам уже приходят клиенты с вопросом: "А могут ли наши инженеры по продажам или команда техподдержки использовать вашего агента?"», — делится Ласкин. Похоже, первый коммерческий успех Asimov может найти не только в разработке, но и в смежных областях, где требуется глубокое понимание технического продукта.