Gemini 3.5 Flash теперь поддерживает Computer Use. Для разработчиков это не просто «ещё одно обновление модели».
Google встроил Computer Use прямо в Gemini 3.5 Flash: агент может через Gemini API работать с браузером, мобильной и desktop-средой. Patrick Loeber из Google DeepMind показал это в X и дал ссылку на GitHub repo, где функцию можно попробовать руками.
Самый интересный вопрос здесь не в том, умеет ли агент нажимать кнопки. Нажимать он уже умеет.
Практический вопрос другой: какие страницы он может открыть? Есть ли у него доступ к production-системам? Нужно ли подтверждение человека перед login, оплатой, удалением или отправкой формы? Если задача упала по timeout или ушла в retry, где смотреть уже потраченные tokens и состояние выполнения?
Computer Use расширяет поверхность действий агента. Он больше не только генерирует текст, пишет код или вызывает функции. Он начинает работать с реальным интерфейсом, внешними сервисами и длинными задачами.
И это касается не только Gemini. Claude Code, Codex CLI, Cursor, Cline и OpenCode уже двигаются в сторону agent workflow: читать repo, запускать команды, править файлы, гонять тесты, держать контекст. Computer Use просто добавляет ещё один слой: агент может трогать не только код, но и браузер, UI, внешние инструменты.
Перед тем как пускать таких агентов в рабочий процесс, я бы сначала проверил:
- есть ли sandbox или отдельное окружение; - какие действия требуют подтверждения человека; - можно ли увидеть logs по шагам агента; - можно ли ограничить стоимость одной задачи; - где хранятся API Key, Base URL, model name и история запросов; - что происходит с task state и token usage при timeout / retry; - получил ли агент только минимальные права для конкретной задачи.
В demo эти вопросы могут быть незаметны.
Но когда агент начинает выполнять длинные задачи или работать с реальным проектом, цена ошибки быстро растёт. Неудачный запуск — это не только один failed request. Это уже потраченный контекст, прочитанные файлы, открытые внешние страницы и иногда изменённое состояние где-то на середине процесса.
Если вы подключаете Claude Code, Codex CLI, Cursor, Cline или OpenCode через внешний API, Base URL, API Key, model name и token usage лучше отслеживать отдельно. В этом и есть практическая ценность API-сервисов вроде LLMEasy.ru: стандартный API Key / Base URL и dashboard, где видны баланс, история запросов, input / output tokens и cache usage.
Но инструмент может только показать конфигурацию и расход. Границы прав агента всё равно нужно проектировать в своём workflow.
Вопрос: вы бы уже доверили агенту браузер в рабочем проекте или пока запускали бы только в отдельной sandbox-среде?