Mistral AI выпустила свои первые «рассуждающие» модели Magistral и добавила режим «рассуждений» в чат-бота

Одна из моделей — Magistral Small на 24 млрд параметров. У неё открытый исходный код.

  • Контекстное окно — 128 тысяч токенов. В «оптимизированном» виде может работать на одной видеокарте Nvidia RTX 4090 или на Mac с 32 ГБ оперативной памяти. Доступна на Hugging Face по лицензии Apache 2.0 — использовать её можно в коммерческих целях.
  • Mistral AI также выпустила «более мощную» версию Magistral — Medium. Превью добавили в API, на облачную платформу Amazon SageMaker и в чат-бота компании Le Chat, где появились кнопки «Рассуждать» и «Чистые рассуждения» (с ними нельзя включить другие инструменты вроде поиска по интернету или «холстов»), а также режим «быстрых ответов».
  • По словам разработчика, Magistral «особенно хорошо» «думает» на английском, французском, испанском, немецком, итальянском, арабском, упрощённом китайском и русском языках. Подходит для разных задач: разработки ПО, стратегического планирования, оценки рисков, креативного письма, юридических исследований, финансовых прогнозов, расчётов оптимизации.
Сравнение некоторых моделей на разных бенчмарках
Сравнение некоторых моделей на разных бенчмарках
  • Mistral AI основали выходцы из Google DeepMind и запрещённой в России Meta в 2023 году. Многие инвесторы верят, что компания сможет закрепиться на международном рынке, писало Bloomberg.
  • За время работы Mistral AI привлекла $1,14 млрд — от Lightspeed Venture Partners, General Catalyst, Andreessen Horowitz, Nvidia и других. Летом 2024 года компания получила оценку в $6 млрд.
8
1
11 комментариев