Google научила Gemini 2.0 Flash генерировать и редактировать изображения
В соцсетях протестировали, как модель заменяет фон, добавляет детали и раскрашивает чёрно-белые фотографии по текстовому запросу.
- Gemini 2.0 Flash — это «универсальная» модель, которая может писать код, создавать аудио, озвучивать текст и анализировать изображения. Теперь Google научила её генерировать картинки.
- Модель может создать или отредактировать изображение по текстовому запросу, а также дополнить ответ генерациями для наглядности, например при запросе кулинарного рецепта.
- Обычно в ответ на просьбу исправить или дополнить картинку модели создают новую генерацию — и она может сильно отличаться от предыдущей. Gemini 2.0 Flash же редактирует первоначальное изображение.
- Один из пользователей протестировал, сможет ли модель заставить героев известных полотен есть мороженое, не изменяя сами картины.
- В другом примере Gemini 2.0 Flash попросили создать персонажа, поместить его в игру и сгенерировать несколько сцен, где он выполняет задания.
- Модель может генерировать не только картинки, но и последовательность кадров для GIF-анимации в едином стиле.
- Также Gemini 2.0 Flash раскрашивает чёрно-белые рисунки и фотографии, меняет фон изображений и объединяет несколько снимков в один.
- Протестировать Gemini 2.0 Flash Experimental можно в AI Studio от Google (сервис не открывается с российских IP-адресов). Для этого в поле Output format нужно выбрать Image and text.
- Компания запустила модель 11 декабря 2024 года. Она может использовать сторонние приложения, чтобы распознавать предметы через камеру, человеческую речь, просматривать, что пользователь делает в приложениях, и давать подсказки, например, для написания кода.
Нейросеть создана на базе тех же технологий, что и «самая продвинутая» модель компании Gemini 2.0.
Модель Gemini 2.0 Flash от Google теперь позволяет редактировать изображения с помощью естественного языка. В отличие от более ранних мультимодальных систем, в которых использовалось сочетание отдельных моделей (например, использование языковой модели вместе с Imagen 3 для генерации изображений), Gemini 2.0 Flash работает в мультимодальном режиме,…
В этой статье в формате «вредных советов» разберем распространенные ошибки, которые возникают у рекламодателей при взаимодействии с digital-агентством как на этапе подготовки к сотрудничеству, так и уже в ходе самой работы. Как их избежать и сделать партнерство выгодным для обеих сторон — читайте в материале.
Функции будут доступны на устройствах Android подписчикам One AI Premium.
Google выпустила новую функцию Gemini под названием Canvas, которая представляет собой интерактивное рабочее пространство, призванное сделать процесс написания текстов и программирования более комфортным и эффективным.
И добавила в бота экспериментальную версию персонализации: помощник будет обращаться к истории поиска пользователя, чтобы давать более релевантные рекомендации.
Google подтянулся к OpenAI и Anthropic – в Gemini теперь есть Canvas, объединяющий написание кода, редактирование и просмотр результата в одном окне.
Экспериментальную функцию называют «расширением» AI Overviews, пока она доступна подписчикам One AI Premium.
Когда же уже Яндекс скопирует?.. не поспевают ребята
Сможет лучше?
На 34 секунде очень красивый кадр
Окей, я не выкупаю, это нейросеть или реальная реклама
"Модель объединила героя с одной фотографии и игрушку с другой в одно изображение." - ну всё, маркетплейсы теперь будут кишмя-кишить "моделями с [нужное_вставить]". В принципе почему-бы и нет.
а рука у девушки на которой она держит медведя всё же странная
Последовательные изображения вот что огонь, инди-гейм-разрабы давно ждали