Отечественный AI-генератор картинок в Telegram от TurboText
Midjourney, DALL-E 2, Jasper Art — генераторы изображений, о которых в 2022 году услышал практический каждый, кто интересуется нейросетями или занимается контентом.
Российские программисты внедрили нейросети для генерации изображений прямо в Telegram — TurboText_bot. Также есть англоязычный бот с тем же набором функций.
Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.
Нейросеть TurboText генерирует реалистичные картинки и аниме, придумывает расширенные текстовые запросы для создания хорошего изображения и увеличивает размер картинки до 3072х3072.
Примеры картинок и запросов для генерации
Реализм
Аниме
По умолчанию картинки генерируются в размере 768х768. В текстовом запросе можно указать параметры размера изображения, например:
- морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, width: 1024, height: 768
- лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, width: 1024, height: 1024
Разработчики добавили в бот отдельный режим, в котором можно увеличить изображение до 3072х3072.
Руки и глаза
Несмотря на серьезный прорыв нейросетей в генерации картинок, ряд проблем остаются нерешенными. Например, современный искусственный интеллект не очень хорошо справляется с отрисовкой человеческих глаз и конечностей. В боте TurboText эта проблема так же присутствует. Разработчики регулярно дообучают модель и нейросеть рисует все лучше и лучше.
Руки стали более четкими, визуально пропорциональными.
Иногда нужно сделать несколько текстовых запросов, чтобы получить результат, где глаза и руки выглядят реалистично.
Текстовые запросы
Для создания картинки достаточно ввести от 1 до 60 слов. Чтобы получить качественную картинку, отражающую вашу задумку, стоит внести больше деталей в текстовый запрос. Разработчики упростили эту задачу для пользователей и внедрили специальную команду для простой генерации запросов. Вводишь одну фразу или слово и получаешь три разных запроса, которые помогут создать детализированную картинку.
Примеры, какие запросы можно получить по одному слову:
Запрос: пожарная машина
Результат: пожарная машина в постапокалиптическом городе, реалистичный рендеринг с октановым числом 4k, великолепная детализация, постобработка, высокая детализация, сложная сложность, эпическая композиция, волшебная атмосфера, кинематографическое освещение
Теперь посмотрим на разницу, если бы ввели обычный запрос «пожарная машина» и запрос, который создала нейросеть.
Как сгенерировать картинку
В разделе «Изображения» можно создать реалистичные картинки и аниме, создать запрос для генерации и увеличить изображение.
Нейросеть генерирует одно изображение от 10 до 20 секунд, в зависимости от заданного размера и сложности текстового запроса.
Спасибо за внимание к материалу:) Если остались вопросы по статье или по работе нейросети — пишите в комментариях.
Сделали сборку свою и теперь это "Отечественный AI генератор"?
Тьфу на вас.
Вот тоже не понял что тут нового. Запросы к Stable Diffusion через бота в телеге сделали, вот и всё 🧐
Stable Diffusion - это такая же обёртка как GPT3 для текстов. Лишь предобученная модель, которую потом файнтюнят и получают результат, накидывают эмбеддингов со стилями к модели и этим уже пользуются. В этом и новизна пожалуй.
модели генерят все кому не лень - но это не значит что они сделали новый продукт
Это ж как с Линуксом, не находите?
Если уровня "поменяли обои" то вполне