Mistral AI выпустила исследовательское превью языковой модели Devstral для кодинговых агентов

С открытым исходным кодом.

  • По словам французского стартапа, Devstral c 24 млрд параметров может работать на одной видеокарте Nvidia RTX 4090 или на Mac с 32 ГБ оперативной памяти. В её создании участвовал разработчик агентов для написания кода All Hands AI.
  • При тестировании на бенчмарке SWE-Bench Verified модель Mistral AI показала производительность в 46,8%, превзойдя GPT-4.1 mini и Claude 3.5 Haiku.
  • Скачать её можно на HuggingFace, Ollama, Kaggle, Unsloth и LM Studio. В API она доступна под названием devstral-small-2505: 1 млн «входных» токенов обойдётся в $0,1, а 1 млн «выходных» — в $0,3 (1 млн токенов — это примерно 750 тысяч слов).
  • Devstral доступна по лицензии Apache 2.0, поэтому использовать её можно и в коммерческих целях.
Сравнение производительности с некоторыми моделями
Сравнение производительности с некоторыми моделями
Вертикаль — производительность. Горизонталь — количество параметров
Вертикаль — производительность. Горизонталь — количество параметров
  • Mistral AI основали выходцы из Google DeepMind и запрещённой в России Meta в 2023 году. Многие инвесторы верят, что компания сможет закрепиться на международном рынке, писало Bloomberg.
  • За время работы Mistral AI привлекла $1,14 млрд — от Lightspeed Venture Partners, General Catalyst, Andreessen Horowitz, Nvidia и других. Летом 2024 года компания получила оценку в $6 млрд.
2
21 комментарий