Google тестирует сервис для генерации изображений по трём референсам

Google тестирует сервис для генерации изображений по трём референсам

1. Что такое Whisk?

Google Labs запустила новый экспериментальный сервис Whisk для генерации изображений без промптов. Вместо текста, пользователи загружают три изображения:

  • Объект (что будет на картинке),
  • Сцена (фон или окружение),
  • Стиль (визуальная атмосфера).

2. Как это работает?

После загрузки изображений, Gemini генерирует промпты, которые передаются в модель Imagen 3 для создания финального изображения. Если результат не совпадает с ожиданиями, пользователи могут отредактировать промпт.

3. Доступность

Пока сервис доступен только в США, но в будущем может расшириться.

Начать дискуссию