{"id":14289,"url":"\/distributions\/14289\/click?bit=1&hash=892464fe46102746d8d05914a41d0a54b0756f476a912469a2c12e8168d8a933","title":"\u041e\u0434\u0438\u043d \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u043b \u043f\u0440\u043e\u0434\u0430\u0436\u0438 \u043d\u0430 5%, \u0430 \u0441\u0440\u0435\u0434\u043d\u0438\u0439 \u0447\u0435\u043a \u2014 \u043d\u0430 20%","buttonText":"","imageUuid":""}

Татьяна

25 янв 2023 25.01.2023

Отечественный AI-генератор картинок в Telegram от TurboText

Midjourney, DALL-E 2, Jasper Art — генераторы изображений, о которых в 2022 году услышал практический каждый, кто интересуется нейросетями или занимается контентом.

Российские программисты внедрили нейросети для генерации изображений прямо в Telegram — TurboText_bot. Также есть англоязычный бот с тем же набором функций.

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

Нейросеть TurboText генерирует реалистичные картинки и аниме, придумывает расширенные текстовые запросы для создания хорошего изображения и увеличивает размер картинки до 3072х3072.

Примеры картинок и запросов для генерации

Реализм

Красивый белый шпиц в профиль на фоне скандинавского пейзажа со звездным небом созвездий северного сияния

Мужчина десантник в голубой футболке в белую полоску

Cute Millie Bobby Brown, Eleven from "stranger things", monochrome, portrait photo, 35 mm, width: 1024, height: 1024

portrait of a Michael Jackson as an undead skeleton lord,cinematic, soft cinematic light, slate gray atmosfere, hdr,cinematic lighting, immense detail, photorealism, ultra realistic, professional photography, depth, beautiful lighting, epic composition

уютное рабочее место за открытым ноутбуком с прекрасным видом из окна, светлые тона, на столе один открытый ноутбук и чашка чая рядом, нежное теплое освещение, снег за окном, заснеженные ели

Human Heart Made of Fruits and Vegetables

мультяшная милая панда профессор сидит в школьном классе и читает книгу

роскошные розовые пионы

Аниме

store full of curious collectibles :: incredible, anime, Digital 2D, animated by Kyoto Animation, Studio Ghibli, Miyazaki, AKIRA art style, beautiful, gorgeous, dramatic lighting

красивая девушка в кожаном платье, русые волосы и зеленые глаза с черным футуристическим автомобилем реалистично 3d визуализация высокого качества

самое красивое произведение абстрактного искусства из когда-либо созданных, смешанная техника, пастельные тона, померанский шпиц, дерево, листья, цветы, капля чернил в воду

Красивая девушка блондинка, портретное фото, задний план в розовых оттенках сакуры, высокая детализация, реалистичный стиль

брюнетка держит на руках кота, повседневная обстановка, в квартире

милый котик гуляет по лесу

По умолчанию картинки генерируются в размере 768х768. В текстовом запросе можно указать параметры размера изображения, например:

морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, width: 1024, height: 768
лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, width: 1024, height: 1024

Разработчики добавили в бот отдельный режим, в котором можно увеличить изображение до 3072х3072.

Размер 768х768

Размер 2048х2048

Руки и глаза

Несмотря на серьезный прорыв нейросетей в генерации картинок, ряд проблем остаются нерешенными. Например, современный искусственный интеллект не очень хорошо справляется с отрисовкой человеческих глаз и конечностей. В боте TurboText эта проблема так же присутствует. Разработчики регулярно дообучают модель и нейросеть рисует все лучше и лучше.

Первая версия нейросети

Текущая версия

Руки стали более четкими, визуально пропорциональными.

This model is good at drawing background with CGI style, both urban and natural

Женское платье в рождественском стиле с рисунком снежинок, размер L, идеальная фигура 90-60-90

девушка стоит на фоне эйфелевой башни, смотря в камеру, улыбается

Иногда нужно сделать несколько текстовых запросов, чтобы получить результат, где глаза и руки выглядят реалистично.

блондинка за рулем шикарного автомобиля, крупный план, реалистичный стиль

Загарелый мужчина позирует на пляже, крупный план

Текстовые запросы

Для создания картинки достаточно ввести от 1 до 60 слов. Чтобы получить качественную картинку, отражающую вашу задумку, стоит внести больше деталей в текстовый запрос. Разработчики упростили эту задачу для пользователей и внедрили специальную команду для простой генерации запросов. Вводишь одну фразу или слово и получаешь три разных запроса, которые помогут создать детализированную картинку.

Примеры, какие запросы можно получить по одному слову:

Нейросеть создает три варианта запросов

Запрос: пожарная машина

Результат: пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение

Теперь посмотрим на разницу, если бы ввели обычный запрос «пожарная машина» и запрос, который создала нейросеть.

пожарная машина

пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение

Как сгенерировать картинку

В разделе «Изображения» можно создать реалистичные картинки и аниме, создать запрос для генерации и увеличить изображение.

Нейросеть генерирует одно изображение от 10 до 20 секунд, в зависимости от заданного размера и сложности текстового запроса.

Спасибо за внимание к материалу:) Если остались вопросы по статье или по работе нейросети — пишите в комментариях.

#нейросети #turbotext #изображения

24K показов

39K открытий

1 репост

169 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Agios Nikolaos

25.01.2023

Сделали сборку свою и теперь это "Отечественный AI генератор"?

Тьфу на вас.

Ответить

Развернуть ветку

Wufus Magnusson

25.01.2023

Вот тоже не понял что тут нового. Запросы к Stable Diffusion через бота в телеге сделали, вот и всё 🧐

Ответить

Развернуть ветку

Олег Рубан

26.01.2023

Stable Diffusion - это такая же обёртка как GPT3 для текстов. Лишь предобученная модель, которую потом файнтюнят и получают результат, накидывают эмбеддингов со стилями к модели и этим уже пользуются. В этом и новизна пожалуй.

Ответить

Развернуть ветку

Agios Nikolaos

26.01.2023

модели генерят все кому не лень - но это не значит что они сделали новый продукт

Ответить

Развернуть ветку

Ольга Васюкова

26.01.2023

Это ж как с Линуксом, не находите?

Ответить

Развернуть ветку

Agios Nikolaos

26.01.2023

Если уровня "поменяли обои" то вполне

Ответить

Развернуть ветку

Показать 169 комментариев . Вы видите только часть дискуссии

Написать комментарий...

166 комментариев

Раскрывать всегда