Любопытные эксперименты Google с генератором изображений: 3 в 1

** Еще больше интересного в моем канале продуктовые штучки**

Google экспериментирует с новым генератором изображений, который объединяет три изображения в одно.

Google Labs (экспериментальное подразделение Google) тестирует новый генератор изображений Whisk. Инструмент позволит вводить подсказки в виде изображений и объединить их в одно:

первое - для действующего персонажа,
второе - для контекста / сцены,
третье - для стиля.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftechcrunch.com%2F2024%2F12%2F16%2Fgoogle-experiments-with-a-new-image-generator-that-remixes-three-images-into-one-creation%2F&postId=1712919" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Например, вы можете выбрать свою фотографию, футуристический пейзаж в качестве сцены и стиль аниме для окончательного вида.

Whisk использует модель генерации изображений Google, Imagen 3, для объединения трех изображений.

Модель автоматически генерирует подпись к изображениям, которая затем используется для руководства Imagen 3 при создании ремикса фотографии. Также можно вводить текстовые подсказки для дальнейшего определения желаемого результата, включая подробные описания, например «Субъект едет на летающем мотоцикле».

Генератор использует изображения в качестве подсказок и не нуждается в словах. Вместо того чтобы вводить длинные текстовые подсказки.

Если нет изображений под рукой, можно нажать на значок игральной кости, чтобы Google предложил несколько изображений для подсказок (судя по всему, эти изображения также сгенерированы ИИ). Вы также можете добавить дополнительные сведения об изображении, которое ищете, но это не обязательно.

Google подчеркивает, что они "создали его для быстрого визуального исследования, а не для пиксельного редактирования. Речь идет об исследовании идей новыми и креативными способами, что позволяет вам работать с десятками вариантов и загружать те, которые вам нравятся".

Сервис может сгенерировать изображения, которые отличаются от ваших ожиданий. Поскольку Whisk фокусируется только на нескольких ключевых характеристиках каждого изображения, итоговые изображения могут быть непоследовательными.

Почему так? Whisk берет из вашего изображения только несколько ключевых характеристик, поэтому он может «промахнуться». Поэтому Whisk позволяет редактировать базовые подсказки.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.theverge.com%2F2024%2F12%2F16%2F24322614%2Fgoogle-whisk-ai-generator-remix-pictures-plug-in&postId=1712919" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Пока никак. Сейчас эксперимент доступен только пользователям из США по адресу labs.google/whisk.

#ии #иибудущее #ai #нейросети #сервисы #будущееии #сервис #иисервисы #иимодели #ииинструменты #ииинновации #whisk #иитехнологии #google #googlelabs #google_labs #text2image #imagen #imagen3

Наташа Хазеева

Будущее

15.12.2024

Почему мы недооцениванием творчество нейросетей?

За последнее время вышло несколько исследований, в которых сравниваются творчество нейросетей и человека, например, картины, поэзию. Исследования проводятся учеными по строгим научным правилам и публикуются в Nature или, напротив, любителями. Результат, впрочем, от этого не меняется: люди склонны оценивать творчество нейросетей как невысокое; любые…

Любопытные эксперименты Google с генератором изображений: 3 в 1

Что может?

Что нового?

Все ли хорошо?

Как попробовать?

Пожалуйста, поддержите меня, поставьте лайк!