Baidu выпустила мультимодальную «размышляющую» модель ERNIE-4.5-VL
Полное название — ERNIE-4.5-VL-28B-A3B-Thinking. У модели 28 миллиардов параметров и 3 миллиарда активных.
ERNIE работает с видео и картинками. Умеет увеличивать изображения и обращает внимание на мелкие детали. По бенчмаркам близка к Gemini 2.5 Pro и GPT-5 High, а в работе с документами и графикам превосходит их.
Веса открыты: https://aistudio.baidu.com/modelsdetail/39280/intro
Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.
Начать дискуссию