Google Labs представила этот инструмент, который работает на базе модели Gemini.
Сервис Whisk не требует от пользователей составления текстовых запросов. Вместо этого, вы просто выбираете три изображения: объект, сцену и стиль. Тестирование уже началось в США!
Как пользоваться Whisk от Google? 🤔
Whisk предназначен для быстрой визуализации идей. Он позволяет «смешивать» различные элементы изображений и создавать уникальные картинки без необходимости в длинных текстовых описаниях. Вот как это работает:
- Загрузка референсов: Вы загружаете три изображения:
- Объект — главный элемент картинки.
- Сцена — фон или окружение.
- Стиль — художественный стиль или настроение.
- Автоматическая генерация: ИИ-модель Gemini анализирует загруженные изображения и создает текстовые промпты, которые передаются генеративной модели Imagen 3. Затем ИИ создает итоговое изображение. 🖼
- Редактирование результата: Если итоговое изображение вас не устраивает, вы можете просмотреть и отредактировать созданные промпты для уточнения деталей. ✏
Например, вы можете загрузить фотографию плюшевого медведя, сцену тропического леса и стиль акварели, чтобы получить картинку медведя в экзотическом окружении. 🐻🌴
Google предупреждает, что сгенерированные изображения могут отличаться от референсов. Например, предмет может изменить форму, цвет или текстуру. Однако это компенсируется возможностью редактирования. 🔧
На данный момент Whisk доступен только в США через Google Labs. Компания надеется получить обратную связь от пользователей и доработать инструмент. Релиз за пределами США пока не планируется. 🌍
Оставайся с нами!
Пользуйся чат-ботом с множеством ИИ!
Скорее пробуй новый инструмент в нашей линейке — Flux! Попробуй прямо сейчас!
#нейросети #чатGPT #Midjourney #чатбот #ИИ #Ai