Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI

Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI

Google анонсировал новую модель генерации и редактирования изображений под названием Gemini 2.5 Flash Image, также известную как nano‑banana. Инструмент уже доступен пользователям через приложение Gemini и платформу Google AI Studio.

Что умеет nano-banana?

  • Консистентность персонажа Модель позволяет сохранять узнаваемость персонажа в разных изображениях. Теперь тот же персонаж может появляться в разных окружениях, под разными ракурсами, оставаясь узнаваемым.
  • Тонкая правка изображения Можно, например, размыть фон или изменить цвет одежды — всё это управляется простыми командами.
  • Комбинирование нескольких изображений Представьте: загрузили фотографию комнаты, затем — изображение предмета. Перемещаете этот предмет внутрь комнаты. Очень удобно для визуального оформления интерьера или дизайна перед покупкой.
  • Соблюдение шаблонов визуального оформления Модель удобно применима для создания визуальных элементов по шаблону: бейджи сотрудников, карточки товаров, обложки для видео и прочее.
  • Доступная цена API Стоимость: $30 за миллион выходных токенов, что дешевле аналогичного API от OpenAI, который стоит $40.
Почему новый инструмент Google для генерации изображений может стать реальным конкурентом OpenAI

Что говорят СМИ

  • По оценке Axios, nano‑banana — это не просто генерация изображений, а инструмент с мощными возможностями редактирования: «... он позволяет не просто создавать изображения, но и выполнять тонкие, многошаговые правки…».
  • Напомним, что в мае 2025 года Google выпустил модель Imagen 4, которая заметно улучшила качество изображения, особенно при создании текста на картинках — более чёткий шрифт и реалистичные детали типа капель и тканей. Gemini (включая nano-banana) работает на её базе, предлагая высокую точность визуализации.
1
Начать дискуссию