Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI
Google анонсировал новую модель генерации и редактирования изображений под названием Gemini 2.5 Flash Image, также известную как nano‑banana. Инструмент уже доступен пользователям через приложение Gemini и платформу Google AI Studio.
Что умеет nano-banana?
- Консистентность персонажа Модель позволяет сохранять узнаваемость персонажа в разных изображениях. Теперь тот же персонаж может появляться в разных окружениях, под разными ракурсами, оставаясь узнаваемым.
- Тонкая правка изображения Можно, например, размыть фон или изменить цвет одежды — всё это управляется простыми командами.
- Комбинирование нескольких изображений Представьте: загрузили фотографию комнаты, затем — изображение предмета. Перемещаете этот предмет внутрь комнаты. Очень удобно для визуального оформления интерьера или дизайна перед покупкой.
- Соблюдение шаблонов визуального оформления Модель удобно применима для создания визуальных элементов по шаблону: бейджи сотрудников, карточки товаров, обложки для видео и прочее.
- Доступная цена API Стоимость: $30 за миллион выходных токенов, что дешевле аналогичного API от OpenAI, который стоит $40.
Что говорят СМИ
- По оценке Axios, nano‑banana — это не просто генерация изображений, а инструмент с мощными возможностями редактирования: «... он позволяет не просто создавать изображения, но и выполнять тонкие, многошаговые правки…».
- Напомним, что в мае 2025 года Google выпустил модель Imagen 4, которая заметно улучшила качество изображения, особенно при создании текста на картинках — более чёткий шрифт и реалистичные детали типа капель и тканей. Gemini (включая nano-banana) работает на её базе, предлагая высокую точность визуализации.
Начать дискуссию