Mistral AI выпустила свои первые «рассуждающие» модели Magistral и добавила режим «рассуждений» в чат-бота
Одна из моделей — Magistral Small на 24 млрд параметров. У неё открытый исходный код.
- Контекстное окно — 128 тысяч токенов. В «оптимизированном» виде может работать на одной видеокарте Nvidia RTX 4090 или на Mac с 32 ГБ оперативной памяти. Доступна на Hugging Face по лицензии Apache 2.0 — использовать её можно в коммерческих целях.
- Mistral AI также выпустила «более мощную» версию Magistral — Medium. Превью добавили в API, на облачную платформу Amazon SageMaker и в чат-бота компании Le Chat, где появились кнопки «Рассуждать» и «Чистые рассуждения» (с ними нельзя включить другие инструменты вроде поиска по интернету или «холстов»), а также режим «быстрых ответов».
- По словам разработчика, Magistral «особенно хорошо» «думает» на английском, французском, испанском, немецком, итальянском, арабском, упрощённом китайском и русском языках. Подходит для разных задач: разработки ПО, стратегического планирования, оценки рисков, креативного письма, юридических исследований, финансовых прогнозов, расчётов оптимизации.
Сравнение некоторых моделей на разных бенчмарках
- Mistral AI основали выходцы из Google DeepMind и запрещённой в России Meta в 2023 году. Многие инвесторы верят, что компания сможет закрепиться на международном рынке, писало Bloomberg.
- За время работы Mistral AI привлекла $1,14 млрд — от Lightspeed Venture Partners, General Catalyst, Andreessen Horowitz, Nvidia и других. Летом 2024 года компания получила оценку в $6 млрд.
11 комментариев