«Сбер» представил обновлённую модель для генерации изображений Kandinsky и нейросеть Kandinsky Video

Последняя позволяет генерировать ролики продолжительностью до восьми секунд.

Пример изображения, сгенерированного Kandinsky 3.0
Пример изображения, сгенерированного Kandinsky 3.0
  • Компания представила версию генеративной модели Kandinsky 3.0. Для её обучения разработчики использовали обновлённый набор данных из 1,5 млн пар «текст — изображение», рассказали в «Сбере». Нейросеть позволяет создавать изображения с разрешением 1024х1024 и выбирать соотношение сторон.
  • Новая версия точнее определяет текстовые запросы пользователей, создаёт более фотореалистичные кадры, а также может генерировать «полноценные художественные картины и арты».
  • Кроме того, Kandinsky 3.0 лучше предыдущих версий понимает «элементы отечественного культурного кода», подчеркнули в компании. В частности, модель «значительно лучше» генерирует советских и российских известных личностей и персонажей, архитектурные достопримечательности и объекты народного искусства — например, гжельскую роспись.
  • Компания также показала новую нейросеть Kandinsky Video. Она способна генерировать ролики продолжительностью до восьми секунд с разрешением 512 х 512, частотой 30 кадров и различным соотношением сторон.
  • Модель обучена на более чем 300 тысячах пар «текст — видео». Генерация одного ролика занимает до трёх минут.
Пример сгенерированного видео
  • В октябре 2023 года «Сбер» добавил в Kandinsky возможность создавать анимации. По одному запросу генерируется четырёхсекундное видео c выбранным эффектом анимации, частотой 24 кадра и разрешением 640x640. Синтез одной секунды видео в среднем занимает около 20 секунд.
  • В ноябре глава «Сбера» Герман Греф рассказал, что сотрудников компании вызывали в прокуратуру после жалобы депутатов на неточное изображение нейросетью российского флага. Модель пришлось редактировать, из-за чего снизились её креативность и точность, указал он.
2222
34 комментария

сотрудников компании вызывали в прокуратуру после жалобы депутатов на неточное изображение нейросетью российского флага.Это какой-то новый уровень сюрреализма.

15

Хорошо что этого Кандинского не обьявили инноагентом, или обьявили в розыск..

8

С каждым днем все больше ощущаешь себя в какой-то антиутопии.

1

А прокуратура вообще в курсе, что нейросеть это не человек и она может рисовать не точно? Господи какой треш🗿

15

Сюр на каждом шагу. Сначала верхушка вещает про развитие технологий и IT. А когда в процессе развития что-то идёт не так, сразу прокуратура и запреты.

4

Комментарий недоступен

1