Новая китайская нейронка Xiaomi MiMo

Новая китайская нейронка Xiaomi MiMo

Xiaomi MiMo – новый китайский open source игрок с акцентом на математические задачи и программирование

Параметры и обучение

MiMo имеет 7 миллиардов параметров (7B), что меньше, чем у крупных закрытых моделей (например, GPT-4 с 1,8 триллионами), но её эффективность достигается за счёт трёхэтапного обучения на 25 триллионах токенов, включая синтезированные данные объёмом ~200 миллиардов токенов.

Бенчмарки

В математических задачах AIME 24-25 модель показала 67,8% правильных ответов, превзойдя OpenAI o1-mini на 12,3%.

В генерации кода (LiveCodeBench v5) успешность составила 89,1%, обогнав Qwen-32B.

Особенности

Оптимизация для работы на потребительских GPU

Заявленная скорость вывода (генерации ответов) на 17% выше, чем у аналогичных моделей. Сама модель достаточно легковесная (7B), что делает ее удобной для локального запуска на своем ПК.

Акцент на «обучении с подкреплением» (RL)

MiMo использует RL для динамической адаптации к задачам, что теоретически позволяет повышать эффективность в процессе использования.

Большей новостей, бесплатных гайдов и промптов для работы с нейронками здесь 👇

6
2 комментария