Максим Корнилов

Разработка 01.09.2025

Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI

Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI

Google анонсировал новую модель генерации и редактирования изображений под названием Gemini 2.5 Flash Image, также известную как nano‑banana. Инструмент уже доступен пользователям через приложение Gemini и платформу Google AI Studio.

Консистентность персонажа Модель позволяет сохранять узнаваемость персонажа в разных изображениях. Теперь тот же персонаж может появляться в разных окружениях, под разными ракурсами, оставаясь узнаваемым.

Тонкая правка изображения Можно, например, размыть фон или изменить цвет одежды — всё это управляется простыми командами.

Комбинирование нескольких изображений Представьте: загрузили фотографию комнаты, затем — изображение предмета. Перемещаете этот предмет внутрь комнаты. Очень удобно для визуального оформления интерьера или дизайна перед покупкой.

Соблюдение шаблонов визуального оформления Модель удобно применима для создания визуальных элементов по шаблону: бейджи сотрудников, карточки товаров, обложки для видео и прочее.

Доступная цена API Стоимость: $30 за миллион выходных токенов, что дешевле аналогичного API от OpenAI, который стоит $40.

Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI

По оценке Axios, nano‑banana — это не просто генерация изображений, а инструмент с мощными возможностями редактирования: «... он позволяет не просто создавать изображения, но и выполнять тонкие, многошаговые правки…».

Напомним, что в мае 2025 года Google выпустил модель Imagen 4, которая заметно улучшила качество изображения, особенно при создании текста на картинках — более чёткий шрифт и реалистичные детали типа капель и тканей. Gemini (включая nano-banana) работает на её базе, предлагая высокую точность визуализации.

1