Baidu выпустила мультимодальную «размышляющую» модель ERNIE-4.5-VL

Полное название — ERNIE-4.5-VL-28B-A3B-Thinking. У модели 28 миллиардов параметров и 3 миллиарда активных.

ERNIE работает с видео и картинками. Умеет увеличивать изображения и обращает внимание на мелкие детали. По бенчмаркам близка к Gemini 2.5 Pro и GPT-5 High, а в работе с документами и графикам превосходит их.

Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.

Начать дискуссию