«Яндекс» рассказал, что научил «Алису AI» лучше генерировать русскоязычные надписи на изображениях

Компания «изменила архитектуру модели» и обучила её на датасете с релевантными картинками и «детальной разметкой» текста на них.

Источник здесь и далее, если не указано иное: «Яндекс»
Источник здесь и далее, если не указано иное: «Яндекс»
  • После обучения модель Alice AI ART «в три раза чаще» генерирует изображения с русскоязычным текстом без ошибок и нечитаемых букв, следует из релиза «Яндекса».
  • При создании промптов пользователям посоветовали «заключать текст в кавычки, писать сложные слова заглавными буквами и разбивать длинные надписи на более короткие фразы».

Примеры генераций обновлённой модели

«Яндекс» рассказал, что научил «Алису AI» лучше генерировать русскоязычные надписи на изображениях
«Яндекс» рассказал, что научил «Алису AI» лучше генерировать русскоязычные надписи на изображениях
«Яндекс» рассказал, что научил «Алису AI» лучше генерировать русскоязычные надписи на изображениях
  • По запросу редакции vc.ru «Яндекс» поделился примерами того, как старая и обновлённая модели справляются с одними и теми же промптами.

Сравнения: слева «было», справа — «стало»

Промпт «Яндекса»: Нарисуй простой логотип для отеля с названием трактир Гаврош. Используй эко-стиль. Дом среди деревьев. Кроны деревьев создают крышу. Название в природном, органичном стиле. Цвета: оттенки зеленого и коричневого.

Генерация vc.ru по тому же промпту
Генерация vc.ru по тому же промпту

Промпт «Яндекса»: Нарисуй гуся, у которого в руках табличка и на табличке написано: Здесь ваш питомец может попить воды.

Генерация vc.ru по тому же промпту
Генерация vc.ru по тому же промпту

Промпт «Яндекса»: Нарисуй открытку с красной лошадью и надписью С НАСТУПИВШИМ 2026 ГОДОМ! СЧАСТЬЯ, ЗДОРОВЬЯ, УСПЕХА!!!

Генерация vc.ru по тому же промпту
Генерация vc.ru по тому же промпту

Промпт «Яндекса»: Нарисуй картинку-открытку с текстом поздравлением с 8 марта маме Анжеле.

Генерация vc.ru по тому же промпту
Генерация vc.ru по тому же промпту
  • В октябре 2025 года компания представила обновлённого чат-бота с ИИ-агентами «Алиса AI». В декабре добавила в него режим редактирования изображений.
7
5
2
1
102 комментария