{"id":14286,"url":"\/distributions\/14286\/click?bit=1&hash=d1e315456c2550b969eff5276b8894057db7c9f3635d69a38d108a0d3b909097","hash":"d1e315456c2550b969eff5276b8894057db7c9f3635d69a38d108a0d3b909097","title":"\u041f\u043e\u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u043d\u0430\u0434 \u043a\u0440\u0443\u043f\u043d\u0435\u0439\u0448\u0438\u043c\u0438 \u0418\u0422-\u043f\u0440\u043e\u0435\u043a\u0442\u0430\u043c\u0438 \u0441\u0442\u0440\u0430\u043d\u044b","buttonText":"","imageUuid":""}

«Сбер» выпустил обновлённую версию нейросети Kandinsky для генерации изображений по текстовому запросу Статьи редакции

Она умеет создавать стикеры и лучше «предшественницы» справляется с портретами, говорят в компании.

Здесь и далее — примеры сгенерированных изображений
  • Kandinsky 2.2 — улучшенная версия одноимённой нейросети, которую «Сбер» представил в июне 2022 года. Это не первое обновление: Kandinsky 2.0 показали в ноябре того же года, а Kandinsky 2.1 — в апреле 2023-го.
  • Протестировать её можно бесплатно на сайте «Сбера», на платформах Fusion Brain и ML Space, через ботов в Telegram и во «ВКонтакте», а также с помощью команды «Запусти художника» на умных устройствах Sber и в приложении «Салют».
  • Разработчики дообучили Kandinsky 2.2 на наборе данных из 1,5 млрд пар «текст-изображение» — это на 300 млн больше пар, чем в дата-сете Kandinsky 2.1. Благодаря этому нейросеть может создавать более фотореалистичные изображения с высоким разрешением, лучше справляется с портретами и умеет изменять соотношение сторон.
  • В новую версию модели также встроили ControlNet — «специальный структурный блок управляемых изменений». Эта архитектура даёт возможность изменять отдельные элементы на уже сгенерированных картинках, сохраняя исходную композицию.
  • Помимо этого, модель научили генерировать стикеры — из них можно собирать пользовательские наборы для Telegram.
  • Kandinsky понимает запросы на 101 языке, включая русский и английский, умеет рисовать в более чем 20 стилях, смешивать несколько рисунков и дорисовывать недостающие части изображения. Её обучали сотрудники Sber AI и учёные Института искусственного интеллекта AIRI на дата-сете Sber AI и SberDevices.
Пример сгенерированных стикеров
Результат, который редактор vc.ru получил в Telegram-боте по запросу «Разные эмоции пользователей интернет-издания vc.ru», попросив нейросеть создать стикеры
0
95 комментариев
Написать комментарий...
Чукча в танке

Сделал около 10 запросов... по моему, это шняга какая-то.. просто рендомные картинки

Ответить
Развернуть ветку
Поручик молчать

Потестил. У Сбер явно проблемы с женщинами

Ответить
Развернуть ветку
Невероятный Блондин

Ты просто не умеешь их готовить.
Главное правильный запрос

Ответить
Развернуть ветку
Забанен. Спасибо ВадимуДи

и тут адовые цветовые кислотные сочетания

Ответить
Развернуть ветку
Meel Light

ну так работай над промтом, и будут тебе не адовые

Ответить
Развернуть ветку
Забанен. Спасибо ВадимуДи

Промт тут совершенно не причем, очевидно это какието внутренние особенности, которые возможно в части случаев могут быть отрегулированы промтом, но тратить промт еще и на это по сути какаято дичь, если даже с задачей формы данная сеть справляется через раз. И да, это подтверждают как опыты юзеров в этом обсуждении так и в остальных статьях про чудесный кандинский на просторах интернета. Пока что очень сыро, имхо

Ответить
Развернуть ветку
Meel Light

Про "сыро" я слышу наверное через раз на каждую инициативу у нас. Уже факт того что есть, отлично. Главное чтобы продолжали.

Ответить
Развернуть ветку
Забанен. Спасибо ВадимуДи

Ну если б они на каждом углу не орали какие они офигенно прорывные и конкуренты миджорни может никто бы так и не говорил 🤷‍♀️ все познается в сравнении, сбер просто местами слишком нос задирает

Ответить
Развернуть ветку
Невероятный Блондин

Обнаженку удалил

Ответить
Развернуть ветку
92 комментария
Раскрывать всегда