Любопытные эксперименты Google с генератором изображений: 3 в 1
** Еще больше интересного в моем канале продуктовые штучки**
Google экспериментирует с новым генератором изображений, который объединяет три изображения в одно.
Что может?
Google Labs (экспериментальное подразделение Google) тестирует новый генератор изображений Whisk. Инструмент позволит вводить подсказки в виде изображений и объединить их в одно:
- первое - для действующего персонажа,
- второе - для контекста / сцены,
- третье - для стиля.
Например, вы можете выбрать свою фотографию, футуристический пейзаж в качестве сцены и стиль аниме для окончательного вида.
Whisk использует модель генерации изображений Google, Imagen 3, для объединения трех изображений.
Модель автоматически генерирует подпись к изображениям, которая затем используется для руководства Imagen 3 при создании ремикса фотографии. Также можно вводить текстовые подсказки для дальнейшего определения желаемого результата, включая подробные описания, например «Субъект едет на летающем мотоцикле».
Что нового?
Генератор использует изображения в качестве подсказок и не нуждается в словах. Вместо того чтобы вводить длинные текстовые подсказки.
Если нет изображений под рукой, можно нажать на значок игральной кости, чтобы Google предложил несколько изображений для подсказок (судя по всему, эти изображения также сгенерированы ИИ). Вы также можете добавить дополнительные сведения об изображении, которое ищете, но это не обязательно.
Google подчеркивает, что они "создали его для быстрого визуального исследования, а не для пиксельного редактирования. Речь идет об исследовании идей новыми и креативными способами, что позволяет вам работать с десятками вариантов и загружать те, которые вам нравятся".
Все ли хорошо?
Сервис может сгенерировать изображения, которые отличаются от ваших ожиданий. Поскольку Whisk фокусируется только на нескольких ключевых характеристиках каждого изображения, итоговые изображения могут быть непоследовательными.
Почему так? Whisk берет из вашего изображения только несколько ключевых характеристик, поэтому он может «промахнуться». Поэтому Whisk позволяет редактировать базовые подсказки.
Как попробовать?
Пока никак. Сейчас эксперимент доступен только пользователям из США по адресу labs.google/whisk.
Пожалуйста, поддержите меня, поставьте лайк!
Модель Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с помощью естественного языка. В отличие от более ранних мультимодальных систем, в которых использовалось сочетание отдельных моделей (например, использование языковой модели вместе с Imagen 3 для генерации изображений), Gemini 2.0 Flash работает в мультимодальном режиме,…
Начнём с самой генерации. Честно говоря, раньше я почти не использовала ChatGPT для создания AI-фото — качество у DALL·E 3 было довольно посредственным, а соотношение сторон всё время застревало на 1:1. Но с недавним обновлением GPT-4o всё кардинально изменилось: качество стало значительно выше, и теперь можно настраивать формат изображения.
Наши любимые соцсети снова попали под раздачу! Госдумой принят закон, запрещающий рекламу в Instagram и Facebook с 1 сентября 2025 года. И да, обе эти платформы принадлежат корпорации Meta, признанной экстремистской и запрещенной в России.
Такое заявление было сделано на недавнем внутреннем стратегическом совещании, с праздничными свитерами. Расскажу, почему на это стоит обратить внимание.
Вас беспокоит, что AI вытеснит фотографов и дизайнеров с рынка? В этой статье я подробно анализирую, как Midjourney 6 и другие генераторы изображений трансформируют рынок визуального контента, какие ниши останутся за людьми, а где AI действительно заменит специалистов. Разбираю инструменты Midjourney и Flux, делюсь конкретными промптами и настройка…
В Google AI Studio появилась новая функция — генерация и редактирование изображений с помощью Gemini 2.0 Flash. Теперь вы можете не только раскрасить черно-белые фото, но и вносить любые визуальные изменения: добавлять объекты, менять освещение, фон или даже стилистику изображения — и всё это по простой текстовой инструкции.
AI co-scientist – это специальная нейро модель для ускорения научных открытий. Использует ИИ для генерации гипотез и анализа данных. Инструмент уже показал свою эффективность в биомедицинских исследованиях.
Generate Video – инструмент от конкурента Sora (OpenAI) позволяет любому создавать 5-секундные видео с разрешением 1080 p.
Google представил обновленную версию Gemini 2.0 Flash с новыми возможностями редактирования изображений. Теперь пользователи могут изменять картинки, просто описывая желаемые изменения обычными словами.
И он имеет все шансы стать новым горячим пирожком. И (все как мы любим!) темная лошадка. Первые отзывы очень хорошие, и модель может быть полезна всем: от маркетологов и продавцов на маркетплейсах до художников.
Там пока по записи. Отправил мейл, жду ответа.
Прикольно, теперь каждый может стать художником)) Хочешь необычную картинку? Просто покажи фото нейросети, и она превратит его в произведение искусства. Очень легко и просто))