Gemini 3.5 Flash теперь поддерживает Computer Use. Для разработчиков это не просто «ещё одно обновление модели».

Gemini 3.5 Flash теперь поддерживает Computer Use. Для разработчиков это не просто «ещё одно обновление модели».

Google встроил Computer Use прямо в Gemini 3.5 Flash: агент может через Gemini API работать с браузером, мобильной и desktop-средой. Patrick Loeber из Google DeepMind показал это в X и дал ссылку на GitHub repo, где функцию можно попробовать руками.

Самый интересный вопрос здесь не в том, умеет ли агент нажимать кнопки. Нажимать он уже умеет.

Практический вопрос другой: какие страницы он может открыть? Есть ли у него доступ к production-системам? Нужно ли подтверждение человека перед login, оплатой, удалением или отправкой формы? Если задача упала по timeout или ушла в retry, где смотреть уже потраченные tokens и состояние выполнения?

Computer Use расширяет поверхность действий агента. Он больше не только генерирует текст, пишет код или вызывает функции. Он начинает работать с реальным интерфейсом, внешними сервисами и длинными задачами.

И это касается не только Gemini. Claude Code, Codex CLI, Cursor, Cline и OpenCode уже двигаются в сторону agent workflow: читать repo, запускать команды, править файлы, гонять тесты, держать контекст. Computer Use просто добавляет ещё один слой: агент может трогать не только код, но и браузер, UI, внешние инструменты.

Перед тем как пускать таких агентов в рабочий процесс, я бы сначала проверил:

- есть ли sandbox или отдельное окружение; - какие действия требуют подтверждения человека; - можно ли увидеть logs по шагам агента; - можно ли ограничить стоимость одной задачи; - где хранятся API Key, Base URL, model name и история запросов; - что происходит с task state и token usage при timeout / retry; - получил ли агент только минимальные права для конкретной задачи.

В demo эти вопросы могут быть незаметны.

Но когда агент начинает выполнять длинные задачи или работать с реальным проектом, цена ошибки быстро растёт. Неудачный запуск — это не только один failed request. Это уже потраченный контекст, прочитанные файлы, открытые внешние страницы и иногда изменённое состояние где-то на середине процесса.

Если вы подключаете Claude Code, Codex CLI, Cursor, Cline или OpenCode через внешний API, Base URL, API Key, model name и token usage лучше отслеживать отдельно. В этом и есть практическая ценность API-сервисов вроде LLMEasy.ru: стандартный API Key / Base URL и dashboard, где видны баланс, история запросов, input / output tokens и cache usage.

Но инструмент может только показать конфигурацию и расход. Границы прав агента всё равно нужно проектировать в своём workflow.

Вопрос: вы бы уже доверили агенту браузер в рабочем проекте или пока запускали бы только в отдельной sandbox-среде?