{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Нейросеть от Сбера Kandinsky 2.1 - шах и мат Midjourney и Stable Diffusion

Нейросеть от Сбера для генерации изображений Kandinsky 2.1 стала самым быстрорастущим сервисом в мире, достигнув 1 млн уникальных пользователей всего за 4 дня, и 2 млн пользователей за 6 дней. Напомню, что это быстрее результата сервиса ChatGPT от OpenAI, которому потребовалось пять дней, чтобы набрать 1 млн пользователей.

Если брать техническую часть, то Kandinsky 2.1 — это обновленное поколение нейросети Kandinsky 2.0 для генерации картинок, которую Сбер запустил летом 2022 года. Новая модель сильно улучшена, она была обучена на 170 миллионах связок «текст-изображение». Kandinsky 2.1 содержит 3,3 миллиарда параметров, в то время как предыдущая модель Kandinsky 2.0 содержала только 2 миллиарда.

Основное отличие Kandinsky 2.1 от ее основных конкурентов Midjourney, Stable Diffusion и DALL-E, в том, что она способна понимать более 100 языков, включая русский, а также в том, что ее можно попробовать сразу на нескольких платформах:

  • сберовской облачной платформе ML Space
  • на fusionbrain.ai
  • На сайте Rudalle
  • в Telegram-боте
  • а также в мобильном приложении Салют и на умных устройствах Sber при помощи команды «Запусти художника»
Москва будущего со Шреком посередине

Что нейросеть Kandinsky 2.1 умеет делать?

  • самая стандартная функция - сгенерировать изображение на основе текстового запроса. Причем можно выбрать более 20 вариантов стилей, от ренессанса и классицизма до реальных 3д фотографий, киберпанка и советских мультфильмов
  • нейросеть умеет смешивать несколько рисунков в один
  • может дорисовывать изображения
  • а также создать картину в режиме бесконечного полотна

Все четыре режима генерации пока доступны только в телеграм боте

Kandinsky 2.1  в телеграм боте

Периодически в некоторых случаях нейросеть может не сработать, часто приходится долго ждать пока будет сгенерировано изображение, иногда появляются ошибки и на сайтах, и в телеграм-боте. Сбер объясняет это большой нагрузкой на сервис.

Из минусов - все картинки генерируются в разрешении 768 × 768 пикселей. Большее разрешение выставить нельзя, хотя современные нейросети уже рисуют картинки качественнее.

Как и в большинстве нейросетей, у Кандинского тоже иногда возникают проблемы при генерировании изображений людей, особенно если их несколько на картинке, и особенно прорисовка их пальцев, и когда они смотрят не прямо на вас, а в профиль.

Резюме

Таким образом, если резюмировать, Kandinsky 2.1. - достаточно интересная нейросеть , которая может составить вполне себе конкуренцию Midjourney, Dall-E и Stable Diffusion.

Из плюсов - то что можно вводить промпты на русском языке и еще 100 других. Кроме того, нейросеть можно использовать через телеграм бот или даже голосовго помощника Сбера.

Из минусов - изображения относительно невысокого разрешения, прорисовка людей в определенных стилях, особенно если на картинке несколько персонажей, иногда оставляет желать лучшего.

Но в целом первое впечатление положительное, думаю буду пользоваться и дальше.

***

О том как использовать инструменты на основе Искусственного интеллекта в личной жизни, карьере и бизнесе, я рассказываю в своих книгах:

0
9 комментариев
Написать комментарий...
Сергей Соколов

Как по мне, очень кайфово и удобно что Kandinsky сделали в телеграм. Ненужно переходить ни на какие сайты. Пользуюсь ежедневно с самого начала, работает топово

Ответить
Развернуть ветку
Avizo Essays

Самое прикольное - это режим бесконечного полотна, как по мне, а так, автор молодец, все четко раскрыл без воды

Ответить
Развернуть ветку
tim-kazancev
Автор

Да, бесконечное полотно затмевает недостаток среднего разрешения)

Ответить
Развернуть ветку
Около

Шедеврум, Kandinsky, отечественные компании нагоняют своими ИИ, с учетом того, что зарубежные чуть тяжелее в доступности

Ответить
Развернуть ветку
tim-kazancev
Автор

Именно так

Ответить
Развернуть ветку
tim-kazancev
Автор

Да, это реально удобно. Еще бы разрешение сделали получше)

Ответить
Развернуть ветку
Дмитрий Чаплинский

А теперь факт, после которого вы не сможете уснуть: у нейросети Kandinsky 2.1 главный разработчик учится в 11 классе)

Ответить
Развернуть ветку
tim-kazancev
Автор

А теперь факты в студию, пожалуйста)
Хотя я бы совсем не удивился

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
6 комментариев
Раскрывать всегда