«Сбер» представил нейросеть Kandinsky для генерации изображений по описанию на русском языке

В компании уверяют, что она генерирует более реалистичные картинки, чем предыдущая нейросеть от «Сбера».

Модель Kandinsky — это улучшенная версия нейросети ruDALL-E, которую «Сбер» представил в ноябре 2021 года, сообщила компания. Она доступна в мобильном приложении «Салют» и на «умных» устройствах «Сбера» по запросу «Включи художника».

Команды Sber AI и SberDevices улучшили работу базовой модели, дообучив ее на 179 млн изображений, снабжённых текстовыми описаниями.

Kandinsky может создавать любые изображения на основе текстового описания: дизайн интерьера, иллюстрации, материалы для рекламы и другого, говорят в компании.

Она способна генерировать изображения с произвольным соотношением сторон, а также лучше справляется с созданием реалистичных изображений с качественной передачей тени, текстур и отражений.

Изображение по запросу «Ночная Москва»
Изображение по запросу «Ночная Москва»

Создание изображений при помощи Kandinsky происходит в три этапа. Сначала Kandinsky на основе текстового описания генерирует заданное количество картинок, затем другая нейросеть — ruCLIP Large — выбирает наиболее удачные. После этого третья нейросеть увеличивает их в размере.

Изображение по запросу «Очень красивый водопад в горах»
Изображение по запросу «Очень красивый водопад в горах»
42
90 комментариев

Комментарий недоступен

25
Ответить

Комментарий недоступен

24
Ответить

А как бы это изобразили вы?)

Ответить

Вот что этот ваш ИИ выдал по запросу "сиськи". Было сложно, но я...

23
Ответить

Хех, ньюфаг. Сложно ему было, видите ли... Сверху нижегородцев-касаток скинули, вот это было сложно, и то совсем немного.

22
Ответить

Очевидна проблема обучения ИИ - тема сисек не раскрыта!

Ответить