Мой секретный AI-тандем: Как я "варю" промпты на английском в Gemini, а "пеку" картинки в ImageFX (и обхожу косяки с текстом)

Привет, VC! Снова Мадлена. Мы уже говорили о том, как AI помогает "не-дизайнерам" вроде меня создавать визуал. Но сегодня я хочу копнуть глубже и поделиться своей личной "кухней" по генерации картинок. Это не просто "написал промпт – получил результат". Это целый процесс, где участвуют два AI-инструмента от Google, немного хитрости, старая добрая Figma и… магия английского языка для промптов. И да, я расскажу, как я обхожу одну из частых проблем AI-генераторов – корявые надписи.

Мой секретный AI-тандем: Как я "варю" промпты на английском в Gemini, а "пеку" картинки в ImageFX (и обхожу косяки с текстом)

Почему просто "попросить ImageFX" на русском не всегда достаточно?

ImageFX от Google – классный инструмент. Он интуитивный, неплохо понимает естественный язык, часто выдает "чистые" результаты. Но иногда, чтобы получить действительно то, что нужно, особенно для сложных или стилизованных изображений, простого запроса на русском мало. Нужен мощный, детализированный, продуманный промпт. И вот тут всплывает важный нюанс: большинство крупных AI-моделей для генерации изображений (включая те, что под капотом у ImageFX) обучались на гигантских массивах англоязычных данных (текст-картинка).

Это значит, что промпты на английском языке они часто понимают точнее, глубже и выдают по ним более релевантные и качественные результаты. Поэтому, даже если я думаю по-русски, финальный "рецепт" для картинки я стараюсь готовить на английском.

И вот тут я обнаружила, что для создания и перевода этих самых промптов мне идеально подходит другой AI-помощник – Google Gemini (или ChatGPT, если вам он привычнее).

Мой "двухфазный" метод: Gemini (мозговой центр и переводчик) + ImageFX (исполнитель)

Представьте, что вы шеф-повар, работающий на международной кухне. Сначала вам нужно тщательно продумать рецепт на своем родном языке, а потом точно перевести его на язык, понятный вашим поварам-иностранцам.

Фаза 1: "Варим" идею на русском и "переводим" на английский с Gemini

Почему Gemini? Потому что он отлично подходит для диалогового брейнсторма, итеративной доработки промпта и качественного перевода с учетом нюансов.

  1. Задаю общую идею (на русском): "Привет, Gemini! Мне нужна картинка для статьи о том, как AI помогает учиться. Главная мысль – AI как дружелюбный репетитор для студента".
  2. Прошу накидать ключевые элементы и стиль (на русском): "Какие образы могут это передать? Какой стиль будет смотреться современно и вдохновляюще? Какая цветовая гамма подойдет?". Gemini начинает предлагать варианты.
  3. Уточняю детали (на русском): "Давай сделаем акцент на выражении лица студента – пусть это будет удивление и радость открытия. AI-аватар пусть будет не роботом, а абстрактными потоками света."
  4. Прошу сформулировать детализированный промпт НА АНГЛИЙСКОМ для ImageFX: "Теперь собери все наши идеи и напиши детализированный промпт на английском языке для ImageFX. Включи туда описание стиля (например, 'photorealistic', 'cinematic lighting'), композиции, освещения и желаемого настроения. Убедись, что он звучит естественно для англоязычного AI".

В результате такого диалога я получаю от Gemini не просто перевод, а хорошо структурированный, насыщенный англоязычными терминами и идиомами промпт, который с большей вероятностью будет правильно понят ImageFX.

  • Пример промпта от Gemini (уже на английском): "Photorealistic image: a young student with an expression of joyful surprise on their face sits at a modern desk in front of an open laptop displaying complex graphs. Abstract, softly glowing streams of energy, symbolizing an AI assistant, float near the laptop. A steaming cup of coffee and a couple of books are also on the desk. The room is filled with warm morning light from a window. Cinematic quality, high detail, shallow depth of field, focus on the student's face and laptop screen. Aspect ratio 16:9."

Фаза 2: "Печём" картинку в ImageFX (и немного колдуем)

Теперь я беру этот "идеальный англоязычный рецепт" от Gemini и иду в ImageFX.

  1. Вставляю промпт: Копирую англоязычный вариант.
  2. Смотрю на результат: ImageFX, получив промпт на "родном" для его модели языке, часто выдает более точные и интересные результаты.
  3. Использую "чипы" и легкую коррекцию (если нужно, тоже на английском): Если ImageFX предлагает "чипы" (модификаторы стиля или деталей), я их использую. Если нужно что-то подправить в промпте, стараюсь делать это тоже на английском для лучшего понимания.
  4. Генерирую несколько вариантов: Чтобы было из чего выбрать.

Проблема с текстом в AI-картинках (и мой лайфхак с Figma)

А теперь о наболевшем. Все, кто работал с AI-генераторами изображений, знают: они ужасно справляются с текстом! Буквы пляшут, слова искажаются. И ImageFX тут не исключение. Даже если вы попросите его на английском "write 'Success' on the image", результат, скорее всего, будет далек от идеала.

Что я делаю? Я просто не прошу AI генерировать текст на картинке. Вместо этого я заранее продумываю, где на изображении должна быть надпись, и прошу AI в англоязычном промпте:

"...leave an empty space at the top of the image suitable for a headline..."Или:"...generate the image so there is a clear background area on the right where I can add text..."

А потом я беру сгенерированную картинку, загружаю ее в Figma (или любой другой графический редактор) и там уже аккуратно добавляю нужный текст нужным шрифтом.

Почему это работает лучше:

  • Полный контроль над текстом.
  • Качество текста.
  • Гибкость.

Да, это лишний шаг. Но он позволяет получить профессионально выглядящий визуал с текстом.

Итог: Gemini (RU/EN) + ImageFX (EN) + Человек + Figma = 🔥

Мой подход к созданию визуала – это такой международный творческий конвейер:

  1. Обсуждение идеи и деталей с Gemini на русском – для максимального взаимопонимания с моей стороны.
  2. Генерация детализированного промпта на английском с помощью Gemini – для максимального взаимопонимания со стороны AI-генератора изображений.
  3. "Выпечка" изображения в ImageFX по англоязычному промпту.
  4. Финальная доводка и добавление текста в Figma.

Этот "тандем" и учет языковых особенностей AI позволяет мне, не будучи дизайнером и не владея английским в совершенстве для составления сложных промптов, получать классные, уникальные картинки.

А как вы создаете визуал с помощью AI? Заметили ли вы разницу в качестве при использовании промптов на разных языках? Какие у вас есть хитрости? Поделитесь своими "рецептами" в комментариях!

Кстати, я часто делюсь своими самыми удачными англоязычными промптами (и результатами их "выпечки" в ImageFX) в своем Telegram-канале "AI без галстука". Если вам интересно заглянуть на мою "международную AI-кухню" – добро пожаловать!

Ссылка:

Спасибо, что дочитали! And may your AI images always be stunning (and with readable text!) 😉.

1
1
9 комментариев