Отечественный AI-генератор картинок в Telegram от TurboText

Midjourney, DALL-E 2, Jasper Art — генераторы изображений, о которых в 2022 году услышал практический каждый, кто интересуется нейросетями или занимается контентом.

Российские программисты внедрили нейросети для генерации изображений прямо в Telegram — TurboText_bot. Также есть англоязычный бот с тем же набором функций.

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

Отечественный AI-генератор картинок в Telegram от TurboText

Нейросеть TurboText генерирует реалистичные картинки и аниме, придумывает расширенные текстовые запросы для создания хорошего изображения и увеличивает размер картинки до 3072х3072.

Примеры картинок и запросов для генерации

Реализм

Красивый белый шпиц в профиль на фоне скандинавского пейзажа со звездным небом созвездий северного сияния
Красивый белый шпиц в профиль на фоне скандинавского пейзажа со звездным небом созвездий северного сияния
<p>Мужчина десантник в голубой футболке в белую полоску</p>

Мужчина десантник в голубой футболке в белую полоску

<p>Cute Millie Bobby Brown, Eleven from "stranger things", monochrome, portrait photo, 35 mm, width: 1024, height: 1024</p>

Cute Millie Bobby Brown, Eleven from "stranger things", monochrome, portrait photo, 35 mm, width: 1024, height: 1024

portrait of a Michael Jackson as an undead skeleton lord,cinematic, soft cinematic light, slate gray atmosfere, hdr,cinematic lighting, immense detail, photorealism, ultra realistic, professional photography, depth, beautiful lighting, epic composition
portrait of a Michael Jackson as an undead skeleton lord,cinematic, soft cinematic light, slate gray atmosfere, hdr,cinematic lighting, immense detail, photorealism, ultra realistic, professional photography, depth, beautiful lighting, epic composition
уютное рабочее место за открытым ноутбуком с прекрасным видом из окна, светлые тона, на столе один открытый ноутбук и чашка чая рядом, нежное теплое освещение, снег за окном, заснеженные ели
уютное рабочее место за открытым ноутбуком с прекрасным видом из окна, светлые тона, на столе один открытый ноутбук и чашка чая рядом, нежное теплое освещение, снег за окном, заснеженные ели
<p>Human Heart Made of Fruits and Vegetables</p>

Human Heart Made of Fruits and Vegetables

<p>мультяшная милая панда профессор сидит в школьном классе и читает книгу</p>

мультяшная милая панда профессор сидит в школьном классе и читает книгу

<p>роскошные розовые пионы</p>

роскошные розовые пионы

Аниме

<p>store full of curious collectibles :: incredible, anime, Digital 2D, animated by Kyoto Animation, Studio Ghibli, Miyazaki, AKIRA art style, beautiful, gorgeous, dramatic lighting</p>

store full of curious collectibles :: incredible, anime, Digital 2D, animated by Kyoto Animation, Studio Ghibli, Miyazaki, AKIRA art style, beautiful, gorgeous, dramatic lighting

<p>красивая девушка в кожаном платье, русые волосы и зеленые глаза с черным футуристическим автомобилем реалистично 3d визуализация высокого качества</p>

красивая девушка в кожаном платье, русые волосы и зеленые глаза с черным футуристическим автомобилем реалистично 3d визуализация высокого качества

<p>самое красивое произведение абстрактного искусства из когда-либо созданных, смешанная техника, пастельные тона, померанский шпиц, дерево, листья, цветы, капля чернил в воду</p>

самое красивое произведение абстрактного искусства из когда-либо созданных, смешанная техника, пастельные тона, померанский шпиц, дерево, листья, цветы, капля чернил в воду

<p>Красивая девушка блондинка, портретное фото, задний план в розовых оттенках сакуры, высокая детализация, реалистичный стиль</p>

Красивая девушка блондинка, портретное фото, задний план в розовых оттенках сакуры, высокая детализация, реалистичный стиль

<p>брюнетка держит на руках кота, повседневная обстановка, в квартире</p>

брюнетка держит на руках кота, повседневная обстановка, в квартире

<p>милый котик гуляет по лесу</p>

милый котик гуляет по лесу

По умолчанию картинки генерируются в размере 768х768. В текстовом запросе можно указать параметры размера изображения, например:

  • морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, width: 1024, height: 768
  • лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, width: 1024, height: 1024

Разработчики добавили в бот отдельный режим, в котором можно увеличить изображение до 3072х3072.

Размер 768х768
Размер 768х768
Размер 2048х2048
Размер 2048х2048

Руки и глаза

Несмотря на серьезный прорыв нейросетей в генерации картинок, ряд проблем остаются нерешенными. Например, современный искусственный интеллект не очень хорошо справляется с отрисовкой человеческих глаз и конечностей. В боте TurboText эта проблема так же присутствует. Разработчики регулярно дообучают модель и нейросеть рисует все лучше и лучше.

Первая версия нейросети 
Первая версия нейросети 
Текущая версия 
Текущая версия 

Руки стали более четкими, визуально пропорциональными.

<p>This model is good at drawing background with CGI style, both urban and natural</p>

This model is good at drawing background with CGI style, both urban and natural

<p>Женское платье в рождественском стиле с рисунком снежинок, размер L, идеальная фигура 90-60-90</p>

Женское платье в рождественском стиле с рисунком снежинок, размер L, идеальная фигура 90-60-90

<p>девушка стоит на фоне эйфелевой башни, смотря в камеру, улыбается</p>

девушка стоит на фоне эйфелевой башни, смотря в камеру, улыбается

Иногда нужно сделать несколько текстовых запросов, чтобы получить результат, где глаза и руки выглядят реалистично.

<p>блондинка за рулем шикарного автомобиля, крупный план, реалистичный стиль</p>

блондинка за рулем шикарного автомобиля, крупный план, реалистичный стиль

<p>Загарелый мужчина позирует на пляже, крупный план</p>

Загарелый мужчина позирует на пляже, крупный план

Текстовые запросы

Для создания картинки достаточно ввести от 1 до 60 слов. Чтобы получить качественную картинку, отражающую вашу задумку, стоит внести больше деталей в текстовый запрос. Разработчики упростили эту задачу для пользователей и внедрили специальную команду для простой генерации запросов. Вводишь одну фразу или слово и получаешь три разных запроса, которые помогут создать детализированную картинку.

Примеры, какие запросы можно получить по одному слову:

Нейросеть создает три варианта запросов
Нейросеть создает три варианта запросов

Запрос: пожарная машина

Результат: пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение

Теперь посмотрим на разницу, если бы ввели обычный запрос «пожарная машина» и запрос, который создала нейросеть.

пожарная машина 
пожарная машина 
пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение
пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение

Как сгенерировать картинку

В разделе «Изображения» можно создать реалистичные картинки и аниме, создать запрос для генерации и увеличить изображение.

Нейросеть генерирует одно изображение от 10 до 20 секунд, в зависимости от заданного размера и сложности текстового запроса.

Спасибо за внимание к материалу:) Если остались вопросы по статье или по работе нейросети — пишите в комментариях.

25K25K показов
40K40K открытий
11 репост
169 комментариев

Крутая новость и теперь число качественно оформленных материалов на вц точно возрастёт 🤘
По традиции оставлю тут ссылочку на чат для всех, кто внедряет ИИ и нейросети в свою работу и жизнь — https://t.me/+MdZUKTUEFbMwM2Zi. Уже более 600 человек, будем рады новичкам 🙌

Ответить

Сделали сборку свою и теперь это "Отечественный AI генератор"?

Тьфу на вас.

Ответить

Вот тоже не понял что тут нового. Запросы к Stable Diffusion через бота в телеге сделали, вот и всё 🧐

Ответить

Здравствуйте) Бот работае на основе архитектуры Stable Diffusion, мы этого не скрываем. НО. Мы самостоятельно обучали нейросеть на генерацию качественных изображений, работаем над ней ежедневно.

помимо изображений у нас есть собственные разработки для генерации контента и проверки качества текста, над которыми мы также интенсивно работаем.

В любом случае, спасибо за интерес к материалу и сервису

Ответить

"Отечественный" - потому что у них отечество американское.
Вон, даже запросы делают на нашем, американском языке

Ответить