Начнем сезон с обзора Nano Banana 🍌
По правде говоря, неделя без компьютера и нормального интернета — это тяжело, особенно когда выходит Nano Banana и хочется быстрее ее потыкать и пощупать. Но я добрался до цивилизации, поэтому ловите краткий «банановый обзорчик».
26 августа 2025 года Google представила Gemini 2.5 Flash (внутреннее название Nano Banana) — свою новую модель для генерации и редактирования изображений. И это не очередной генератор картинок, а полноценная визуальная экосистема, способная понимать сложный контекст, поддерживать согласованность персонажей и объектов и, что самое главное, точно следовать инструкциям пользователя.
Я пользуюсь «Бананой» в Google AI Studio, там все просто и нативно. Переходите на aistudio.google.com и дальше:
1) Выбираете модель Gemini 2.5 Flash
2) Нажимаете на иконку изображения, чтобы прикрепить референсные картинки
3) Пишете промпты на любом языке, но английский модель понимает лучше
4) Можете поиграть с «температурой» (рекомендуется 0.4–0.8 для изображений).
5) Я поставил максимальное количество токенов на выходе для более детальной генерации.
Еще доступ к Gemini 2.5 Flash можно получить тут:
- Gemini API — для разработчиков (оплата за использование).
- Vertex AI — корпоративное решение с расширенными функциями.
- Gemini Native Image в чате Gemini — нажмите «Создать изображение».
- Adobe Firefly — полная интеграция (20 бесплатно в месяц, затем безлимитно с Creative Cloud).
- Adobe Express — удобный интерфейс для пользователей.
- Freepik — интеграция с инструментами ИИ для изображений.
- Poe by Quora — доступ к нескольким моделям, включая Gemini.
Цены и лимиты
При использовании через API/Studio/Vertex:
- $0.039 за изображение (в среднем 1290 токенов).
- Лимиты: 10 запросов в минуту (бесплатный тариф), 60 запросов в минуту (платный).
- Максимум на входе: 5 изображений одновременно.
- Разрешение на выходе: до 4K (4096×4096).
Через Adobe Firefly:
- 20 бесплатных изображений в месяц для всех пользователей.
- Безлимитно до 1 сентября для платных подписчиков Creative Cloud.
- После 1 сентября: пользователи Express получают безлимитный доступ.
Что мне больше всего понравилось в Nano Banana по сравнению с FLUX Kontext:
- Может объединить от 2 до 5 изображений в одну картинку.
- Очень хорошо удерживает «идентичность» персонажа при итерациях.
- Добавление и удаление объектов.
- Может изменять конкретные элементы через промпт.
- Есть знания о мире, и модель реально понимает культурные отсылки.
- Время генерации — 2–4 секунды.
- Отрисовка текста — действительно пишет слова правильно.
- Понимание 3D-пространства — поворачивает объекты, меняет перспективу.
- Понимает, какой свет должен быть в разное время суток.
- Реалистично изменяет текстуры.
- Создавать в нем скетчи — одно удовольствие.
Если интересно, могу следующим постом рассказать про бизнес-кейсы и «домашнее» использование Gemini 2.5 Flash. Просто дайте знать нашим тайным способом — 🔥
Подписывайтесь на Telegram Силиконовый Мешок.