Начнем сезон с обзора Nano Banana 🍌

По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый обзорчик».

Начнем сезон с обзора Nano Banana 🍌

26 августа 2025 года Google представила Gemini 2.5 Flash (внутреннее название Nano Banana) — свою новую модель для генерации и редактирования изображений. И это не очередной генератор картинок, а полноценная визуальная экосистема, способная понимать сложный контекст, поддерживать согласованность персонажей и объектов и, что самое главное, точно следовать инструкциям пользователя.

Я пользуюсь «Бананой» в Google AI Studio, там все просто и нативно. Переходите на aistudio.google.com и дальше:

1) Выбираете модель Gemini 2.5 Flash

2) Нажимаете на иконку изображения, чтобы прикрепить референсные картинки

3) Пишете промпты на любом языке, но английский модель понимает лучше

4) Можете поиграть с «температурой» (рекомендуется 0.4–0.8 для изображений).

5) Я поставил максимальное количество токенов на выходе для более детальной генерации.

Еще доступ к Gemini 2.5 Flash можно получить тут:

- Gemini API — для разработчиков (оплата за использование).

- Vertex AI — корпоративное решение с расширенными функциями.

- Gemini Native Image в чате Gemini — нажмите «Создать изображение».

- Adobe Firefly — полная интеграция (20 бесплатно в месяц, затем безлимитно с Creative Cloud).

- Adobe Express — удобный интерфейс для пользователей.

- Freepik — интеграция с инструментами ИИ для изображений.

- Poe by Quora — доступ к нескольким моделям, включая Gemini.

Цены и лимиты

При использовании через API/Studio/Vertex:

  • $0.039 за изображение (в среднем 1290 токенов).
  • Лимиты: 10 запросов в минуту (бесплатный тариф), 60 запросов в минуту (платный).
  • Максимум на входе: 5 изображений одновременно.
  • Разрешение на выходе: до 4K (4096×4096).

Через Adobe Firefly:

  • 20 бесплатных изображений в месяц для всех пользователей.
  • Безлимитно до 1 сентября для платных подписчиков Creative Cloud.
  • После 1 сентября: пользователи Express получают безлимитный доступ.

Что мне больше всего понравилось в Nano Banana по сравнению с FLUX Kontext:

  • Может объединить от 2 до 5 изображений в одну картинку.
  • Очень хорошо удерживает «идентичность» персонажа при итерациях.
  • Добавление и удаление объектов.
  • Может изменять конкретные элементы через промпт.
  • Есть знания о мире, и модель реально понимает культурные отсылки.
  • Время генерации — 2–4 секунды.
  • Отрисовка текста — действительно пишет слова правильно.
  • Понимание 3D-пространства — поворачивает объекты, меняет перспективу.
  • Понимает, какой свет должен быть в разное время суток.
  • Реалистично изменяет текстуры.
  • Создавать в нем скетчи — одно удовольствие.

Если интересно, могу следующим постом рассказать про бизнес-кейсы и «домашнее» использование Gemini 2.5 Flash. Просто дайте знать нашим тайным способом — 🔥

Подписывайтесь на Telegram Силиконовый Мешок.

Начать дискуссию