Agentic Vision в Gemini 3 Flash

(новый этап анализа изображений)

Обычные модели анализируют изображения одним статичным взглядом. Если ропустили деталь - приходится гадать. А вот в Gemini появилась фича Agentic Vision, которая превращает работу с картинками в активный процесс. Модель теперь сама решает, как исследовать изображение – приближает, вращает, размечает.

Как это работает?

Цикл из трех шагов:

Think: анализирует запрос и картинку, строит план действий

Act: генерит и выполняет код (масштабирование, аннотации, расчеты)

Observe: изучает измененное изображение перед финальным ответом

Попробовать можно в Google AI Studio или Vertex AI, включив "Code Execution". В мобильном приложении Gemini функция появляется у тех, кто выбрал "Thinking" в настройках модели.

Подписывайтесь на Telegram Точки над ИИ.

1
Начать дискуссию