реклама
разместить

Любопытные эксперименты Google с генератором изображений: 3 в 1

** Еще больше интересного в моем канале продуктовые штучки**

Google экспериментирует с новым генератором изображений, который объединяет три изображения в одно.

Что может?

Google Labs (экспериментальное подразделение Google) тестирует новый генератор изображений Whisk. Инструмент позволит вводить подсказки в виде изображений и объединить их в одно:

  • первое - для действующего персонажа,
  • второе - для контекста / сцены,
  • третье - для стиля.

Например, вы можете выбрать свою фотографию, футуристический пейзаж в качестве сцены и стиль аниме для окончательного вида.

Whisk использует модель генерации изображений Google, Imagen 3, для объединения трех изображений.

Модель автоматически генерирует подпись к изображениям, которая затем используется для руководства Imagen 3 при создании ремикса фотографии. Также можно вводить текстовые подсказки для дальнейшего определения желаемого результата, включая подробные описания, например «Субъект едет на летающем мотоцикле».

Что нового?

Генератор использует изображения в качестве подсказок и не нуждается в словах. Вместо того чтобы вводить длинные текстовые подсказки.

Если нет изображений под рукой, можно нажать на значок игральной кости, чтобы Google предложил несколько изображений для подсказок (судя по всему, эти изображения также сгенерированы ИИ). Вы также можете добавить дополнительные сведения об изображении, которое ищете, но это не обязательно.

Google подчеркивает, что они "создали его для быстрого визуального исследования, а не для пиксельного редактирования. Речь идет об исследовании идей новыми и креативными способами, что позволяет вам работать с десятками вариантов и загружать те, которые вам нравятся".

Все ли хорошо?

Сервис может сгенерировать изображения, которые отличаются от ваших ожиданий. Поскольку Whisk фокусируется только на нескольких ключевых характеристиках каждого изображения, итоговые изображения могут быть непоследовательными.

Почему так? Whisk берет из вашего изображения только несколько ключевых характеристик, поэтому он может «промахнуться». Поэтому Whisk позволяет редактировать базовые подсказки.

Как попробовать?

Пока никак. Сейчас эксперимент доступен только пользователям из США по адресу labs.google/whisk.

Пожалуйста, поддержите меня, поставьте лайк!

77
реклама
разместить
2 комментария

Там пока по записи. Отправил мейл, жду ответа.

Прикольно, теперь каждый может стать художником)) Хочешь необычную картинку? Просто покажи фото нейросети, и она превратит его в произведение искусства. Очень легко и просто))

Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с использованием естественного языка
Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с использованием естественного языка

Модель Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с помощью естественного языка. В отличие от более ранних мультимодальных систем, в которых использовалось сочетание отдельных моделей (например, использование языковой модели вместе с Imagen 3 для генерации изображений), Gemini 2.0 Flash работает в мультимодальном режиме,…

2020
OpenAI снова взрывает рынок: GPT-4o теперь генерит картинки, делает баннеры, вставляет текст на фото

Начнём с самой генерации. Честно говоря, раньше я почти не использовала ChatGPT для создания AI-фото — качество у DALL·E 3 было довольно посредственным, а соотношение сторон всё время застревало на 1:1. Но с недавним обновлением GPT-4o всё кардинально изменилось: качество стало значительно выше, и теперь можно настраивать формат изображения.

OpenAI снова взрывает рынок: GPT-4o теперь генерит картинки, делает баннеры, вставляет текст на фото
Новый законопроект о запрете рекламы в соцсетях. Страшный сон маркетологов и блогеров.

Наши любимые соцсети снова попали под раздачу! Госдумой принят закон, запрещающий рекламу в Instagram и Facebook с 1 сентября 2025 года. И да, обе эти платформы принадлежат корпорации Meta, признанной экстремистской и запрещенной в России.

Google делает ставку на мощный рывок Gemini в 2025 году

Такое заявление было сделано на недавнем внутреннем стратегическом совещании, с праздничными свитерами. Расскажу, почему на это стоит обратить внимание.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.androidauthority.com%2Fgoogle2025-gemini-plans-3511805%2F&postId=1736411" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
1111
11
~40 млн AI-картинок в день, 90 млн пользователей и $4 млрд в индустрии: кто и как зарабатывает на AI фото- и видеоконтенте?
Сгенерировано в Midjourney
55
11
11
Нейросети для создания изображений в 2025. Как Midjourney 6 и Flux меняют рынок фотореалистичного контента

Вас беспокоит, что AI вытеснит фотографов и дизайнеров с рынка? В этой статье я подробно анализирую, как Midjourney 6 и другие генераторы изображений трансформируют рынок визуального контента, какие ниши останутся за людьми, а где AI действительно заменит специалистов. Разбираю инструменты Midjourney и Flux, делюсь конкретными промптами и настройка…

22
Как использовать Gemini 2.0 Flash для редактирования изображений с помощью текста

В Google AI Studio появилась новая функция — генерация и редактирование изображений с помощью Gemini 2.0 Flash. Теперь вы можете не только раскрасить черно-белые фото, но и вносить любые визуальные изменения: добавлять объекты, менять освещение, фон или даже стилистику изображения — и всё это по простой текстовой инструкции.

11
Google представил виртуального научного помощника - AI co-scientist

AI co-scientist – это специальная нейро модель для ускорения научных открытий. Использует ИИ для генерации гипотез и анализа данных. Инструмент уже показал свою эффективность в биомедицинских исследованиях.

33
Вышел ИИ генератор видео от Adobe

Generate Video – инструмент от конкурента Sora (OpenAI) позволяет любому создавать 5-секундные видео с разрешением 1080 p.

33
11
реклама
разместить
Как получить доступ в России и редактировать изображения в Gemini 2.0 Flash от Google прямо в Телеграм
Как получить доступ в России и редактировать изображения в Gemini 2.0 Flash от Google прямо в Телеграм

Google представил обновленную версию Gemini 2.0 Flash с новыми возможностями редактирования изображений. Теперь пользователи могут изменять картинки, просто описывая желаемые изменения обычными словами.

22
Вышел новый китайский генератор изображений

И он имеет все шансы стать новым горячим пирожком. И (все как мы любим!) темная лошадка. Первые отзывы очень хорошие, и модель может быть полезна всем: от маркетологов и продавцов на маркетплейсах до художников.

11