Baidu выпустила ERNIE 5.0 — мультимодальную модель уровня GPT-5 и Gemini 3 Pro. Бесплатно, господа
Qwen и DeepSeek от всё тех же братьев-китайцев существенно уступают лидерам отрасли, а халявы-то, пусть и условной, хочется. Ну вот теперь ребята из Baidu подсуетились и сделали всё красиво. Уже и чат есть, можно смело тестировать.
В общем, новая мультимодалка может похвастать 2,4 триллиона параметров, работает с текстом, изображениями, аудио и видео в единой архитектуре.
ERNIE 5.0 обучена на текстах, изображениях, аудио и видео одновременно, а не через отдельные энкодеры. Такой же подход используют GPT-5 и Gemini 3, но ERNIE добавляет к этому еще и генерацию изображений и видео. Всё и сразу в режиме «одного окна». Госуслуги практически 😂
Особенно хороша новая модель в текстах, изображениях и аудио, здесь она прям ощутимо обходит GPT-5 в бенчмарках. А вот кодит ИИ-дитя китайцев весьма посредственно, не их конёк. Но и без того новую модель можно смело тестировать.
🔗 Протестировать можно здесь: ernie.baidu.com.
Подписывайтесь на Telegram Нейрочеловек.