«Яндекс» представил нейросеть YandexART для создания картинок и анимации по текстовым запросам Статьи редакции
Она создаёт более реалистичную и детализированную графику, чем предыдущая модель в «Шедевруме», говорят в компании.
- YandexART создаёт изображения и анимацию методом каскадной диффузии — сначала генерирует картинки и кадры по запросу, а затем поэтапно добавляет детали и увеличивает их разрешение, рассказали в «Яндексе».
- Нейросеть уже работает в приложении «Шедеврум», которое компания представила в апреле 2023 года, и создаёт иллюстрации для рекламных объявлений в «Яндекс Бизнесе». В будущем разработчики планируют её добавить в «Клавиатуру» (пользователи смогут сгенерировать картинку и установить её фоном) и в другие сервисы.
По сравнению с предыдущим поколением диффузионной модели, которая использовалась в «Шедевруме», YandexART создаёт более реалистичную и детализированную графику, говорят в компании. По внутренней оценке, её результаты лучше в 60% случаев.
- Чтобы улучшить качество, разработчики в полтора раза увеличили размер обучающего набора данных — до 330 млн изображений с текстовыми описаниями.
- Они используют дообучение с подкреплением: специалисты отсматривают результаты генерации YandexART и отмечают удачные и неудачные варианты. Так нейросеть лучше понимает, как правильнее изображать животных, объекты и так далее, отметили в компании.
21K
показов
11K
открытий
Как будто уже достаточно подобных сервисов, можно было на чем-то более уникальном сосредоточиться
Единого лидера пока нет.
Midjourney для картинок. Stable Diffusion для картинок и видео. D-ID для выражений лиц. Появились Adobe Firefly и InVideo AI.
У каждого свои фишки — что-то получается лучше, что-то хуже.
Выиграет тот, с кем больше можно будет заработать (или сэкономить).
Фото со вчерашнего выступления одного рекламного агентства из Флориды на MAMA Georgia в Тбилиси, где они показали два похожих ролика и сравнили, насколько быстрее получается делать с AI.