Любопытные эксперименты Google с генератором изображений: 3 в 1

** Еще больше интересного в моем канале продуктовые штучки**

Google экспериментирует с новым генератором изображений, который объединяет три изображения в одно.

Что может?

Google Labs (экспериментальное подразделение Google) тестирует новый генератор изображений Whisk. Инструмент позволит вводить подсказки в виде изображений и объединить их в одно:

  • первое - для действующего персонажа,
  • второе - для контекста / сцены,
  • третье - для стиля.

Например, вы можете выбрать свою фотографию, футуристический пейзаж в качестве сцены и стиль аниме для окончательного вида.

Whisk использует модель генерации изображений Google, Imagen 3, для объединения трех изображений.

Модель автоматически генерирует подпись к изображениям, которая затем используется для руководства Imagen 3 при создании ремикса фотографии. Также можно вводить текстовые подсказки для дальнейшего определения желаемого результата, включая подробные описания, например «Субъект едет на летающем мотоцикле».

Что нового?

Генератор использует изображения в качестве подсказок и не нуждается в словах. Вместо того чтобы вводить длинные текстовые подсказки.

Если нет изображений под рукой, можно нажать на значок игральной кости, чтобы Google предложил несколько изображений для подсказок (судя по всему, эти изображения также сгенерированы ИИ). Вы также можете добавить дополнительные сведения об изображении, которое ищете, но это не обязательно.

Google подчеркивает, что они "создали его для быстрого визуального исследования, а не для пиксельного редактирования. Речь идет об исследовании идей новыми и креативными способами, что позволяет вам работать с десятками вариантов и загружать те, которые вам нравятся".

Все ли хорошо?

Сервис может сгенерировать изображения, которые отличаются от ваших ожиданий. Поскольку Whisk фокусируется только на нескольких ключевых характеристиках каждого изображения, итоговые изображения могут быть непоследовательными.

Почему так? Whisk берет из вашего изображения только несколько ключевых характеристик, поэтому он может «промахнуться». Поэтому Whisk позволяет редактировать базовые подсказки.

Как попробовать?

Пока никак. Сейчас эксперимент доступен только пользователям из США по адресу labs.google/whisk.

Пожалуйста, поддержите меня, поставьте лайк!

44
1 комментарий

Там пока по записи. Отправил мейл, жду ответа.