Мы неделю тестировали Nano Banana PRO и теперь точно знаем, что она умеет!
И это просто фантастика! Встречайте - полный реальный гайд по Nano Banana PRO!
Содержание:
Nano Banana Pro - это не просто генератор картинок, а полноценный визуальный движок, который может нарисовать что угодно - от фотореалистичных сцен и инфографики до чертежей, интерфейсов и пиксель арта. Давайте вместе разберемся, как превратить Nano Banana Pro в своего штатного художника, дизайнерскую студию и генератор визуальных концептов одновременно.
Немного теории
Google AI Studio - платформа от Google для работы с моделями семейства Gemini. Через неё удобно экспериментировать с промптами, настраивать конфигурации и получать готовый код для интеграции в приложения.
🔥🔥🔥Все задачи по ИИ закрываю в одном месте - SYNTX AI. Для своих подписчиков оставляю промокод NEIROSKUF - забирайте горячую скидку в 15% на любой тариф и получите доступ к топовым нейросетям практически бесплатно без VPN уже сегодня!
Nano Banana Pro (Gemini 3 Pro Image) - образная модель на базе Gemini 3 Pro. Основные возможности:
- генерация изображений по тексту,
- редактирование и доработка загруженных изображений,
- смешивание до 14 входных картинок,
- работа с актуальными данными через Google Search,
- мультиязЫчный текст прямо на изображениях,
- генерация в разрешении до 4K.
Nano Banana Pro в Google AI Studio
В AI Studio Nano Banana Pro выбирается в списке моделей как одна из Gemini 3 Pro Image моделей. В интерфейсе доступны: поле для текста, возможность добавлять изображения в промпт, настройки соотношения сторон, размера, инструментов (поиск и т.п.), предпросмотр результата, кнопка получения кода (Python, JS и др.). Pro-версия привязана к платному проекту - нужен включённый биллинг и рабочий API-ключ.
Кстати, начнем именно с части для разработчиков.
Настройка проекта и API-ключа
Необходимы:
- проект в Google Cloud
- включённый биллинг
- включённый Gemini API
- API-ключ (через AI Studio или Google Cloud Console)
- установленный SDK (google-genai или @google/genai)
Инициализация клиента
После этого клиент готов к работе с Nano Banana Pro.
Базовая генерация изображений
Простейший вызов - один текстовый промпт и изображение на выходе:
Для разных задач удобно использовать разные стили и форматы.
Примеры промптов и иллюстраций
Фотореалистичный объект
Промпт:
A photorealistic close up of a cup of cappuccino on a wooden table, shallow depth of field, soft morning light, 3-2 aspect ratio
Крупный план чашки кофе на деревянном столе, размытие фона.
Плоская иллюстрация для статьи
Промпт:
Flat illustration of a laptop connected to cloud services, minimalist style, pastel colors, long 16-9 layout, no text
Набор иконок
Промпт:
Nine simple vector style icons on a white background: email, chat bubble, document, cloud, lock, user, search, settings, analytics. Flat geometric shapes, consistent color palette
Чертёж в стиле технической схемы
Промпт:
Technical blueprint style drawing of a quadcopter drone from top view, white lines on blue background, labeled parts, 4-3 aspect ratio
Макет мобильного приложения
Промпт:
Clean mobile app screen design for a habit tracker, light theme, simple rounded cards, 9-16 vertical layout, no real logo or brand
Режим "мышления" модели
Режим "мышления" позволяет получать помимо изображения ещё и текстовые рассуждения модели о том, как интерпретируется промпт. Включается через thinking_config.
В "мыслях" модель может разложить будущую сцену по шагам, например описать логику расположения объектов, освещения и настроения.
Дополнительные примеры задач, где мышление полезно
Сложный сюжет
Промпт:
Create a single image that shows the daily routine of a software engineer from morning to night, all in one scene, with different zones for each time of day, realistic but slightly stylized
Иллюстрация "один день из жизни" в одной сцене.
Многослойная инфографика
Промпт:
Design a detailed infographic that explains the full product development lifecycle from idea to launch, with clear stages, arrows, and icons, suitable for a conference slide
Сцена с множеством взаимодействий
Промпт:
A busy futuristic street market with many different characters interacting, robots, humans, neon signs, food stalls, depth and perspective, cinematic lighting
Search Grounding - привязка к поиску
Search Grounding позволяет использовать свежие данные из интернета. Инструмент google_search включается в конфиге.
Пример с прогнозом погоды:
Дополнительные примеры инфографики и диаграмм
Биржевой график
Промпт:
Search the web for the latest 7 days stock price of a major tech company and draw a clean line chart with dates on the x axis and price on the y axis, add small icons for key news events on the timeline
Карта мира с числами
Промпт:
Search the web for current population numbers of USA, India, China and Brazil and create a world map highlighting these countries with big numeric labels and simple icons
Временная шкала события
Промпт:
Search the web for the main milestones in the history of electric cars and generate a horizontal timeline infographic with years and short descriptions
Генерация 4K
Параметр image_size="4K" позволяет получить картинку с высокой детализацией. Пример с дубом:
4K имеет смысл для сложных сцен, карт, постеров, детализированных макетов.
Дополнительные примеры для 4K
Изометрическая карта города
Промпт:
Highly detailed 4K isometric city map with residential blocks, parks, rivers, bridges and skyscrapers, soft colors, many small details
Технический чертёж устройства
Промпт:
4K technical drawing of a mechanical watch movement with exploded view, labeled parts, clean lines on light background, suitable for a poster
Постер фильма
Промпт:
4K cinematic movie poster for a science fiction adventure, main character in the center, supporting characters around, starry space background, dramatic lighting, empty space at the bottom for title
Polyglot Banana - мультиязычные возможности
Модель способна:
- генерировать текст на разных языках прямо в картинке
- переводить существующие изображения с одного языка на другой
- сохранять дизайн и верстку при замене языка
Пример с инфографикой на испанском и японском уже показан выше. Ниже - ещё варианты.
Примеры мультиязычных задач
Упаковка продукта
Промпт для первой версии: Design a minimalistic label for a sparkling water bottle in English, with product name, ingredients and slogan, clean layout
Промпт для перевода: Translate all text on this label to German, keep layout, colors and typography consistent
Плакат с правилом
Промпт: Make a safety poster for a factory in Spanish, explaining that protective glasses must be worn at all times, with clear icons and bold headline
Затем: Create a version of this poster in Russian with the same design and structure
Смешивание изображений
Nano Banana Pro принимает до 14 изображений в contents и текст, описывающий задачу. Это используется для:
- композиции из нескольких портретов
- коллажей
- переноса стиля
- замены элементов сцены
Базовый пример группового фото
Примеры задач со смешиванием
Перенос стиля рисунка
Промпт:
Redraw the scene from the first image in the style of the second image: bold comic book lines, flat shadows, limited color palette
Перенос элементов одежды и аксессуаров
Промпт:
Using the person from the first photo as the base, dress them in all the main clothing and accessory elements from the second photo, keeping their body shape, pose and face unchanged, and match the fabrics, textures and colors as closely as possible
Перенос всех персонажей в новую сцену
Промпт:
Copy all characters from the first image into the environment of the second image, matching the art style, perspective, lighting direction, shadows and overall color grading so they look naturally integrated into the new scene
Постер с типографикой по референсу
Промпт:
Extract the main character from the first image and transform them into a cinematic movie poster shot, keeping their likeness and pose, then apply title typography and layout inspired by the second image, using similar font style, hierarchy and spacing, so the final result looks like a clean, modern film poster
Продвинутые сценарии Nano Banana Pro
Пиксель-арт с данными из поиска
Промпт:
Search the web for the main milestones in the career of a well known computer scientist and generate an isometric pixel art scene that shows their career path as a series of connected platforms, one platform per milestone
Фотореалистичный макет буклета
Промпт:
A photorealistic image of a glossy theater show program lying on a red velvet seat, we can clearly see the cover and an inside page with a photo of the stage, studio lighting, shallow depth of field
Хиро секция лендинга
Промт:
You are a product designer for SaaS tools. Using this offer text: "Track your small business cashflow in real time across all bank accounts in one clean dashboard", create a hero section for a landing page. Put a large, punchy headline at the top, a short supporting subheadline under it, and a primary CTA button. On the right side, show a simple mockup of an analytics dashboard, on the left side keep the text and button. Style it as a modern, minimal product website with lots of white space and soft rounded cards. Use a calm blue and soft gray color palette and make the layout easy to adapt to web.
Промо пост для соцсетей
Промт:
You are a creative director for a direct to consumer brand. Use a product photo of a minimalist water bottle placed on a plain background and turn it into a promo image for Instagram. Keep the bottle in the center and add space on the right side for text. Add a bold headline: "Hydrate Better, Not Harder" and a small subline: "Double wall stainless steel. 24 hours cold." Style it as a modern lifestyle brand visual with a lot of negative space. Use only two accent colors, soft beige and deep navy, and keep the typography large and readable on a mobile screen. Format it as a 1080x1080 square.
Дизайн упаковки кофе
Промт:
You are a packaging designer for a specialty coffee brand called "Slow Peak". Imagine a standard coffee bag dieline with front, back and side panels. Design the layout so the front panel has the logo at the top, the blend name "Midnight Bloom" in the middle, and key info like origin and roast level at the bottom. The back panel should contain brewing tips and a short brand story. The style should be clean and contemporary, with a small abstract mountain illustration and lots of breathing room. Use off white as the base, charcoal for text, and a single accent color like deep teal for the illustration and small details.
Визуал кейса до-после
Промт:
You are an art director preparing a product case study. Use two UI screenshots of a dashboard: one is the old version and the other is the redesigned version. Create a single wide comparison visual where the old design is on the left with a subtle label "Before" and the new design is on the right with a subtle label "After". Add a small, centered title at the top: "Dashboard Redesign Results". Below each screenshot, add two very short bullet points that explain what was improved. Keep the layout minimal, with a white background and clean typography, and make sure both UI screenshots stay sharp and undistorted.
Танцовщица хип-хоп на фоне граффити
Промт:
Dynamic full body digital illustration of a young female hip hop dancer in an urban alley covered in bold, colorful graffiti murals. She is frozen mid move in a powerful groove, knees bent, torso leaning forward, one arm raised and the other extended, hair flying to show motion. She wears a fitted white crop top and ripped wide leg cargo jeans. Her arms are heavily tattooed and she has chunky gold chains and large gold hoop earrings that catch the light. Style: crisp, high contrast illustration with street art and pop art influences, graphic outlines, vibrant saturated colors, soft motion blur around hair and clothing, simple background details that keep the focus on the dancer, high resolution.
Сюрреалистичная стеклянная бутылка с трактором и полем
Промт:
Surreal high end digital artwork. In the center of the scene, place a tall clear glass bottle with a cork on a subtle reflective surface. Inside the bottle, put a perfectly scaled miniature tractor that exactly matches the reference tractor, with the same cabin shape, wheels, attachments, decals, color accents and overall design, rendered with realistic metal and rubber materials. The tractor is driving through a tiny golden wheat field that fills the bottom of the bottle, with individual wheat stalks gently bending and catching the light. Outside the bottle, the environment is a stylized wheat landscape at sunset: warm orange and pink sky with soft clouds and distant fields that visually blend with the miniature field inside, as if it is one continuous world. Use warm backlighting to emphasize the transparency and thickness of the glass, the subtle highlights and refractions on the curved surface, and the metallic reflections on the tractor. Keep a clear contrast between the warm tones of the wheat and sky and the cool clarity of the glass. Textures should be very detailed: delicate glass reflections, sharp wheat heads, believable light and shadow on the tractor. Mood: calm rural evening with a touch of magic. Slight diagonal perspective for depth, with the bottle and tractor as the only subjects, no extra objects. Ultra high resolution, near photorealistic digital painting.
Ночной московский неон с настраиваемым текстом
Ultra detailed cinematic night scene in Moscow during a light rain. Use a wide angle view of a narrow city street with wet asphalt and puddles shining under the lights. On one side, show an old red brick building with classic Moscow architecture. On its facade, mount a large vintage neon sign with thick tubes that clearly spell the text: Спасибо, что читаете канал Нейроскуфа in Cyrillic. The neon glows in strong pink and blue tones, casting colored light onto the wet bricks and creating sharp, readable reflections of the text in the puddles on the street. The sign should be perfectly legible both on the surface and in the reflections. Add gentle rain streaks and a bit of mist catching the colored light. Keep the rest of the scene darker and more muted so the neon sign is the main focus. Style: hyper realistic, moody, cinematic lighting, shallow depth of field, 8K resolution, strong emphasis on reflections, wet surfaces and atmosphere.
Практические рекомендации
Как в целом думать о запросе к модели
Nano Banana Pro лучше всего работает, когда к ней относятся как к подрядчику, а не к магической кнопке "сделай красиво". Модель умеет очень много, но не читает мысли. Чем яснее поставлена задача и чем понятнее описан результат, тем меньше сюрпризов на выходе. Практически это значит, что любой промпт стоит строить вокруг четырех опор: контекст сцены, ключевые объекты, визуальный стиль и формат. Если хотя бы одна из этих опор размыта, модель начинает додумывать за пользователя и часто уходит не туда.
Контекст и смысл сцены
Первое, о чем стоит думать, - не "что нарисовать", а "зачем это изображение". Обложка ролика, слайд для презентации, инфографика на сайт, мем, инструкция, чертеж - это разные задачи, и модель под каждую будет строить разные решения. Поэтому полезно прямо в промпте задавать назначение: например, написать, что это "title slide illustration", "landing hero image", "poster", "instructional infographic". Тогда модель понимает, нужен ли акцент на одном объекте, нужен ли плотный текст, сколько деталей допустимо и можно ли оставлять пустое пространство.
Сам контекст сцены тоже лучше проговаривать. Не "нарисуй человека", а "человек стоит в офисе открытого типа", не "сделай карту", а "схематичная карта метро условного города без реальных названий, только линии и маркеры". Чем яснее окружение, тем меньше каша из случайных деталей.
Ключевые объекты и действия
Следующий слой - описание того, что именно должно быть в кадре. Полезно мысленно представить себе итоговую сцену и выписать, какие элементы в ней обязательны, а какие второстепенны. Например, в сцене "человек за ноутбуком в кафе" обязательными могут быть сам человек, ноутбук и общий вайб кафе, а детали на столе уже не критичны. Все, что обязательно, стоит назвать в промпте простым языком: "one person", "laptop", "wooden table", "indoor cafe".
Если есть действие, его тоже лучше явно описывать. "Человек улыбается и смотрит в камеру" даёт один результат, "человек смотрит в экран, сосредоточен" - другой. Модель хорошо понимает простые глаголы и эмоции: smiling, laughing, thinking, arguing, celebrating. Абстрактные формулировки вроде "динамичная сцена" лучше разворачивать в конкретику: кто куда смотрит, что делает, как реагирует.
Стиль: фото, иллюстрация, чертёж, инфографика
Очень частая ошибка - не говорить модели, в каком именно визуальном жанре нужен результат. По умолчанию Nano Banana Pro любит фотореализм, и если не указать стиль, она часто выдаёт "под фотографию". Если это не цель, лучше сразу уточнить. Рабочий набор стилей примерно такой: "photorealistic photo", "3D render", "flat illustration", "vector icon", "pixel art", "watercolor painting", "technical blueprint", "comic page", "UI mockup". Эти ярлыки можно комбинировать с уточнениями вроде "minimalistic", "vintage", "high contrast", "pastel colors".
Для инфографики и схем важно проговаривать, что это именно инфографика или схема. Запросы вроде "draw how sonnets work" часто превращаются в абстрактную картинку, а не в структуру с блоками и стрелками. Формулировка "infographic that explains...", "diagram that shows..." гораздо точнее направляет модель к прямоугольникам, стрелкам и подписям.
Формат: aspect ratio, плотность информации, пустое пространство
Формат влияет не только на размер файла, но и на композицию. Если не задать соотношение сторон, модель выбирает его сама, и потом бывает сложно впихнуть картинку в нужное место. Поэтому почти всегда полезно заранее понимать, куда изображение пойдет: вертикальный постер, горизонтальный слайд, квадратный блок, длинный баннер.
Aspect ratio можно задавать и параметром, и словами в промпте, вроде "wide 16-9 layout", "square format", "vertical 9-16 composition". Важно понимать, что под разные форматы модель по-разному расставляет акценты. Для постера лучше просить один крупный главный объект и место под заголовок. Для инфографики - достаточно плотное заполнение, но при этом стоит отдельно попросить "clear layout, enough white space so text is readable".
Еще один момент - плотность информации. Если нужно много текста, графиков и деталей на одном полотне, это всегда отдельный вызов. Здесь лучше явно просить читаемую структуру: "structured layout with sections for...", "large headings", "short labels under icons". И добавить, что текст "must be clearly readable" - модель в этом случае сильнее напрягается с аккуратной типографикой.
Работа с текстом на изображении
Текст на картинках - одна из сильных сторон Nano Banana Pro, но только если правильно формулировать запросы. Для статичного плаката или инфографики полезно сначала в голове прикинуть, сколько текстовых блоков реально нужно. Если заставить модель написать на изображении полновесную статью, буквы гарантированно превратятся в кашу. Для длинного текста лучше оставить на картинке только заголовок и, максимум, короткие подписи, а сам текст перенести в верстку.
Когда важна конкретная формулировка заголовка, её стоит прямо вставлять в промпт, заключив в кавычки и указав, что это текст на постере: "write the title 'Nano Banana Pro guide' at the top". Если нужен текст не на английском, язык нужно указать: "title in Russian", "body text in Spanish". Для перевода уже готовых картинок удобно формулировать задачи типа "translate all text on this poster to German, keep the same layout and style", тогда модель сосредотачивается именно на подмене текстовых блоков.
Полезно помнить про читаемость. Если без уточнений попросить "small labels", модель иногда экономит место настолько, что текст физически не прочитать. Формулировки "large, clearly readable labels", "big headline, high contrast between text and background" заметно улучшают ситуацию.
Использование референсов и смешивание изображений
Nano Banana Pro особенно выигрывает, когда в запрос включаются не только слова, но и примеры. Под референсом могут выступать фото, чертежи, скриншоты интерфейса, логотипы, картинки с нужным стилем. Вместо того чтобы долго объяснять "интерьер в стиле лофта с белыми кирпичами и деревянными балками", проще приложить фотографию такого интерьера и в тексте сказать: "use the interior style from the second image".
Если референсов несколько, модель нормально понимает формулировки "from the first image", "from the second image" и т.п. Четкая схема работает особенно хорошо: первая картинка - сцена, вторая - стиль, третья - фон, четвертая - объект, который нужно встроить. Тогда текст может выглядеть так: "keep the person from the first image, replace the background with the setting from the second image, and render everything in the illustration style of the third image".
Количество референсов стоит держать разумным. Да, технически можно подать до десятка, но чем их больше, тем сложнее модели угодить всем одновременно. На практике 2-4 картинки уже дают отличный контроль: одна для содержания, одна для стиля, плюс максимум пара дополнительных для деталей.
Итерации и "разговор" с моделью
Один из главных практических навыков - перестать пытаться угадать идеальный промпт с первого раза. Гораздо эффективнее относиться к генерации как к диалогу. На первом шаге можно описать сцену достаточно грубо: контекст, основные объекты, стиль, формат. Получив результат, проще понять, чего не хватает или что лишнее, и уже на втором шаге формулировать корректировки: "make the background brighter", "reduce the number of small elements", "change the color palette to pastel tones", "remove text and keep only icons".
При работе через чат имеет смысл не обрывать сессию после каждого изображения. Модель помнит предыдущий контекст, и фразы вроде "now turn this into a blueprint style", "translate this infographic to Japanese" воспринимаются как операции над уже созданной картинкой, а не как новая задача с нуля. Это сильно ускоряет серию правок.
Если изображение пошло совсем не туда, полезно не просто надиктовывать новый длинный промпт, а сначала проговорить, что именно было не так. Простейшие формулировки "the scene is too busy, make it simpler", "the style is too realistic, make it more flat and minimalistic" помогают модели "сдвинуться" в нужном направлении.
Когда и как подключать поиск
Search Grounding имеет смысл использовать не всегда. Если картинка абстрактная или условная, лишняя привязка к фактам только создаст шум. Но как только речь идет о реальных числах, реальных географических объектах, конкретных датах или актуальных характеристиках устройств, поиск становится хорошим инструментом.
Подключать его стоит осознанно. Внутри промпта важно явно обозначать, какие данные нужно найти: "search the web for the latest 5 day weather forecast for Tokyo", "search for current population numbers", "search for key historical milestones". После этого можно формулировать, как именно данные превратить в картинку: "draw a horizontal timeline", "create a bar chart", "highlight these countries on a map". Если просто написать "use real data", модель может взять любую условную статистику из своих внутренних знаний, а не реальное состояние мира.
После генерации инфографики имеет смысл смотреть на источники, которые модель указывает в метаданных, и при необходимости сверять ключевые числа. Nano Banana Pro стремится к правде, но не заменяет полноценную проверку фактов, когда от точности зависят решения.
Управление разрешением и затратами
Разрешение влияет и на качество, и на стоимость. 4K удобно использовать для постеров, детализированных схем, игровых карт и всего того, что будет смотреться крупно или пойдет в печать. Но это тяжёлая артиллерия, и гонять в 4K каждую пробную вариацию нет смысла. Рабочий подход - держать черновую работу в 1K или 2K, пока не станет понятна структура и стиль, а затем самый удачный вариант пересобрать в 4K с тем же промптом и настройками.
Aspect ratio, как уже говорилось, лучше задавать заранее. Искусственное изменение формата постфактум через кроп чаще всего ломает композицию, особенно в инфографике и UI макетах. Если уже известно, что картинка будет в шапке сайта под 21-9, сразу просить такой формат, а не пытаться потом вытянуть из квадрата вытянутую полоску.
По стоимости и лимитам отдельный вопрос - batch генерация. Если планируется серия баннеров, набор иллюстраций к статьям или разные языковые версии одной инфографики, выгоднее собрать промпты в пакет и отправить как батч. Это чуть медленнее в часах, но дешевле и лучше дружит с лимитами.
Типичные проблемы и как их править
Когда результат не устраивает, почти всегда можно найти причину в промпте или в настройках. Если сцена перегружена, стоит явно просить "fewer elements", "simpler composition", "minimalistic design" и убрать из текста всё лишнее. Если картинка скучная и "плоская", помогают уточнения по освещению и глубине: "dramatic lighting", "strong contrast", "shallow depth of field", "cinematic look".
Если текст на картинке плохо читается, полезно отдельно попросить "big clear font", "high contrast between text and background", "avoid decorative fonts". Если модель уходит в ненужную тему, потому что промпт двусмысленный, нужно переформулировать, убрав спорные слова. Например, слова вроде "epic", "crazy", "wild" иногда толкают модель в сторону мемного или карикатурного стиля, когда нужен был строгий корпоративный визуал.
Когда модель упорно игнорирует какой-то элемент, помогает вынос этого элемента в начало промпта и дополнительное усиление, вроде "the main focus is...", "centered on...", "with a single large...". Порядок слов и акцент в описании действительно влияют на то, к чему Nano Banana Pro относится как к главному.
Сбор собственной библиотеки промптов
По мере работы с Nano Banana Pro быстро становится понятно, что самые удачные промпты нужно не просто "помнить", а хранить. Удобно делать себе собственную библиотеку: удачные запросы к инфографике, к UI макетам, к постерам, к комиксам, к техническим схемам. Внутри такой библиотеки можно отмечать, для чего именно промпт показал себя хорошо, и какие настройки дополнительно использовались.
Полезная привычка - сохранять не только финальный текст промпта, но и пару промежуточных версий, чтобы было видно, как менялись формулировки от первой черновой до рабочей. Это сильно сокращает время, когда приходится решать похожую задачу во второй или третий раз.
Если все эти принципы собрать вместе, Nano Banana Pro перестает вести себя как капризный генератор случайных картинок и становится предсказуемым инструментом: даёт инфографику, которая не стыдно поставить на слайд, чертежи, которые можно рассматривать, макеты, по которым реально понятно, как будет выглядеть продукт. Главное - относиться к промптам как к техническому заданию и не бояться шаг за шагом приближать модель к нужному результату.