Новый виртуальный художник от Сбера: встречайте нейросеть Kandinsky 2.2

С улучшенным разрешением генерации, эффектом фотореализма и возможностью вносить локальные изменения в синтезированное изображение.

Новый виртуальный художник от Сбера: встречайте нейросеть Kandinsky 2.2

Новая версия модели научилась создавать фотореалистичные изображения с более высоким разрешением сторон, рисовать детализированные портреты и даже генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации. Это стало возможным благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet.

Kandinsky 2.2 понимает запросы на русском и английском языках (и даже смайлики), умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).

Для дообучения нейросети использовался датасет в размере 1,5 млрд пар «текст — изображение». Это на 300 млн больше, чем в предыдущей версии — Kandinsky 2.1, которая стала самой быстрорастущей нейросетью в мире, набрав один миллион пользователей всего за 4 дня после выхода.

В чём особенность последней доработки

До Kandinsky 2.2 ни одна генеративная сеть не позволяла контролировать процесс синтеза изображения: можно было долго подбирать промт для желаемой сцены, но так и не получить полностью подходящее изображение. В новом релизе нейросети Сбера вы сможете управлять положением какого-то объекта на картинке, его формой, позой, контурами или границами:

Новый виртуальный художник от Сбера: встречайте нейросеть Kandinsky 2.2

Также значительно улучшилась генерация изображений в сравнении с предыдущими версиями нейросети:

Новый виртуальный художник от Сбера: встречайте нейросеть Kandinsky 2.2

О технических деталях Kandinsky 2.2 читайте в статье на Хабре.

Как можно протестировать модель

Оценить возможности нейросети можно на промостранице модели, на платформе FusionBrain.AI и в Telegram-боте, а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Авторы

Модель Kandinsky 2.2 была разработана и обучена исследователями команды Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Коллектив авторов: Арсений Шахматов (главный контрибьютор), Антон Разжигаев, Владимир Архипкин, Игорь Павлов, Ангелина Куц, Андрей Кузнецов, Денис Димитров.

2525
18 комментариев

Наверное братцы перестарались ... Предлагаю оставить доступ к версии 2.1

2

...не различает художественные авторские стили и техники ... сплошной Фотореализм...вероятно обучение состояло в устранении нестандартного взгляда...это и понятно ...видимо учителя, воспитанные на болонской системе и алгоритмах выдали результат своих компетенций) а...что ...так "чистенько, средненько...как у всех"...

2

Вы правы, он не понимает стили авторов. Я составил целый список из 300 шуток, и старая модель Кандинского отрисовывала их в соответствии с их стилем, как и нужно. А эта модель постоянно стремится к зеленому цвету и постоянно добавляет зеленые фильтры на изображение. Она даже рисует игрушки там, где нужно было быть серьезной теме

Потерялись творческие способности...а был реально творческим инструментом, теперь стал таким же как все генераторы ... кукольно-няшным...прежние промты, оригинальные художественные стили не распознает... Не узнаю Кандинского...

1

Вы правы, он даже не может распознать то, что распознавала прошлая модель, а то, что выдает, это вообще ужас. Также он все время рисует в одном стиле. По сути, он не может теперь раскрыть, расширить и дополнить идею. По ощущениям будто бы разработчик вырезали много функций. Самое обидное столько всего не успел на старой модели Кандинского на генерировать. Нужно искать замену.

Похоже, что предыдущая версия обучалась на иллюстрациях реальных художников, а новую обучили на картинках разных нейросетей в угоду юридической чистоте.

Кандинский 2.2. промт одинаковый...

1