«Сбер» представил нейросеть Kandinsky для генерации изображений по описанию на русском языке

В компании уверяют, что она генерирует более реалистичные картинки, чем предыдущая нейросеть от «Сбера».

Модель Kandinsky — это улучшенная версия нейросети ruDALL-E, которую «Сбер» представил в ноябре 2021 года, сообщила компания. Она доступна в мобильном приложении «Салют» и на «умных» устройствах «Сбера» по запросу «Включи художника».

Команды Sber AI и SberDevices улучшили работу базовой модели, дообучив ее на 179 млн изображений, снабжённых текстовыми описаниями.

Kandinsky может создавать любые изображения на основе текстового описания: дизайн интерьера, иллюстрации, материалы для рекламы и другого, говорят в компании.

Она способна генерировать изображения с произвольным соотношением сторон, а также лучше справляется с созданием реалистичных изображений с качественной передачей тени, текстур и отражений.

Создание изображений при помощи Kandinsky происходит в три этапа. Сначала Kandinsky на основе текстового описания генерирует заданное количество картинок, затем другая нейросеть — ruCLIP Large — выбирает наиболее удачные. После этого третья нейросеть увеличивает их в размере.

Изображение по запросу «Очень красивый водопад в горах»

#новость #сбер #нейросети