Nano banana от Google: фотошоп словами. Что реально умеет Gemini 2.5 Flash Image

Google выкатил новую модель для работы с картинками — Gemini 2.5 Flash Image. Внутреннее название — nano banana. Пока одни пишут про «убийцу фотошопа», собираем факты: что она реально делает, где доступна и зачем это знать медиаспецам.

Nano banana от Google: фотошоп словами. Что реально умеет Gemini 2.5 Flash Image

В чём фишка?

Nano banana - это не просто генератор картинок, а инструмент для правок «словами». Главные трюки:

Inpainting - точечные правки внутри кадра (убери стакан, добавь собаку, поменяй фон).

Outpainting - дорисовка сцены за границами картинки (расширь фон, продолжи интерьер).

Google прокачал самое больное место - сохранение образа. Теперь персонаж или объект остаётся узнаваемым даже после серии изменений и «прыжков» из одной сцены в другую.

Что умеет?

- заменять объекты и фоны без «мыла» и артефактов;

- собирать каталожные карточки для e-commerce;

- аккуратно работать с водой, текстурами, надписями;

- переносить персонажей в новые сцены и держать их «целыми»;

- работать итеративно - правки поверх правок без потери стиля.

Где доступно?

Приложение Gemini - редактирование, смешивание фото и последовательные правки (запуск с 26 августа 2025).

Для разработчиков - через Gemini API, AI Studio и Vertex AI. Цена примерно $0,039 за изображение.

Что пока нельзя?

- нет точного кадрирования под формат (например, «сделай квадрат 16:9» пока не работает как инструмент);

- слабые места: мелкие лица, орфография на картинках, «фактические» детали;

- жёсткие фильтры по политике безопасности: опасный и вредный контент отсекаются, изображения маркируются водяным знаком SynthID.

Зачем медиаспецу?

Это не «убийца фотошопа», а:

- новый помощник, который ускоряет производство рекламы и презентаций;

- экономит на фотосессиях и долгих правках;

- помогает тестировать разные визуальные концепции; встраивается в привычные процессы - через Google-сервисы и даже продукты Adobe.

Правки делаются текстом, персонажи остаются узнаваемыми, результат маркируется водяным знаком. Для медиаспецов это инструмент, который реально экономит время и деньги :)

1 комментарий