«Яндекс» рассказал, что научил «Алису AI» лучше генерировать русскоязычные надписи на изображениях
Компания «изменила архитектуру модели» и обучила её на датасете с релевантными картинками и «детальной разметкой» текста на них.
Источник здесь и далее, если не указано иное: «Яндекс»
- После обучения модель Alice AI ART «в три раза чаще» генерирует изображения с русскоязычным текстом без ошибок и нечитаемых букв, следует из релиза «Яндекса».
- При создании промптов пользователям посоветовали «заключать текст в кавычки, писать сложные слова заглавными буквами и разбивать длинные надписи на более короткие фразы».
Примеры генераций обновлённой модели
- По запросу редакции vc.ru «Яндекс» поделился примерами того, как старая и обновлённая модели справляются с одними и теми же промптами.
Сравнения: слева «было», справа — «стало»
Промпт «Яндекса»: Нарисуй простой логотип для отеля с названием трактир Гаврош. Используй эко-стиль. Дом среди деревьев. Кроны деревьев создают крышу. Название в природном, органичном стиле. Цвета: оттенки зеленого и коричневого.
Генерация vc.ru по тому же промпту
Промпт «Яндекса»: Нарисуй гуся, у которого в руках табличка и на табличке написано: Здесь ваш питомец может попить воды.
Генерация vc.ru по тому же промпту
Промпт «Яндекса»: Нарисуй открытку с красной лошадью и надписью С НАСТУПИВШИМ 2026 ГОДОМ! СЧАСТЬЯ, ЗДОРОВЬЯ, УСПЕХА!!!
Генерация vc.ru по тому же промпту
Промпт «Яндекса»: Нарисуй картинку-открытку с текстом поздравлением с 8 марта маме Анжеле.
Генерация vc.ru по тому же промпту
- В октябре 2025 года компания представила обновлённого чат-бота с ИИ-агентами «Алиса AI». В декабре добавила в него режим редактирования изображений.
102 комментария