Mistral AI выпустила исследовательское превью языковой модели Devstral для кодинговых агентов
С открытым исходным кодом.
- По словам французского стартапа, Devstral c 24 млрд параметров может работать на одной видеокарте Nvidia RTX 4090 или на Mac с 32 ГБ оперативной памяти. В её создании участвовал разработчик агентов для написания кода All Hands AI.
- При тестировании на бенчмарке SWE-Bench Verified модель Mistral AI показала производительность в 46,8%, превзойдя GPT-4.1 mini и Claude 3.5 Haiku.
- Скачать её можно на HuggingFace, Ollama, Kaggle, Unsloth и LM Studio. В API она доступна под названием devstral-small-2505: 1 млн «входных» токенов обойдётся в $0,1, а 1 млн «выходных» — в $0,3 (1 млн токенов — это примерно 750 тысяч слов).
- Devstral доступна по лицензии Apache 2.0, поэтому использовать её можно и в коммерческих целях.
Сравнение производительности с некоторыми моделями
Вертикаль — производительность. Горизонталь — количество параметров
- Mistral AI основали выходцы из Google DeepMind и запрещённой в России Meta в 2023 году. Многие инвесторы верят, что компания сможет закрепиться на международном рынке, писало Bloomberg.
- За время работы Mistral AI привлекла $1,14 млрд — от Lightspeed Venture Partners, General Catalyst, Andreessen Horowitz, Nvidia и других. Летом 2024 года компания получила оценку в $6 млрд.
21 комментарий