Обзор на ERNIE‑Image. Китайский поисковик Baidu бесплатно выкатил открытую нейросеть, которая рвёт конкурентов в генерации текста внутри изображений

ERNIE‑Image — это новая открытая модель от Baidu, которая неожиданно ворвалась в топ генераторов изображений. Она создана на базе Diffusion Transformer (DiT) и при размере всего 8B параметров показывает результаты уровня моделей в 2–3 раза больше. Главная фишка — идеальный рендер текста прямо внутри картинки, включая длинные абзацы, китайский и анг…

Обзор на ERNIE‑Image. Китайский поисковик Baidu бесплатно выкатил открытую нейросеть, которая рвёт конкурентов в генерации текста внутри изображений
4
1