Mistral AI выпустила исследовательское превью языковой модели Devstral для кодинговых агентов

С открытым исходным кодом.

По словам французского стартапа, Devstral c 24 млрд параметров может работать на одной видеокарте Nvidia RTX 4090 или на Mac с 32 ГБ оперативной памяти. В её создании участвовал разработчик агентов для написания кода All Hands AI.
При тестировании на бенчмарке SWE-Bench Verified модель Mistral AI показала производительность в 46,8%, превзойдя GPT-4.1 mini и Claude 3.5 Haiku.
Скачать её можно на HuggingFace, Ollama, Kaggle, Unsloth и LM Studio. В API она доступна под названием devstral-small-2505: 1 млн «входных» токенов обойдётся в $0,1, а 1 млн «выходных» — в $0,3 (1 млн токенов — это примерно 750 тысяч слов).
Devstral доступна по лицензии Apache 2.0, поэтому использовать её можно и в коммерческих целях.

Сравнение производительности с некоторыми моделями

Вертикаль — производительность. Горизонталь — количество параметров

Mistral AI основали выходцы из Google DeepMind и запрещённой в России Meta в 2023 году. Многие инвесторы верят, что компания сможет закрепиться на международном рынке, писало Bloomberg.
За время работы Mistral AI привлекла $1,14 млрд — от Lightspeed Venture Partners, General Catalyst, Andreessen Horowitz, Nvidia и других. Летом 2024 года компания получила оценку в $6 млрд.

Евгения Евсеева

07.03.2025

«Мы создаём новое на основе друг друга»: глава Mistral AI рассказал, что не воспринимает DeepSeek как конкурента, но собирается выпустить модель «мощнее», чем у него

И достаточно скоро.

Глава Mistral AI Артур Менш. Источник: Bloomberg

#новости #mistral