Microsoft выпустила обновленную малую языковую модель Phi-4

Компания Microsoft пополнила своё семейство генеративных моделей Phi новой разработкой Phi-4. По утверждению создателей, она обучалась на более качественном наборе данных, за счёт чего в итоге превзошла предыдущие версии Phi, а также некоторые модели аналогичного характера.

Phi-4 относится к малым языковым моделям и имеет 14 миллиардов параметров. Она конкурирует с аналогичными моделями малых размеров – GPT-4o mini, Gemini 2.0 Flash и Claude 3.5 Haiku. За счет размера их проще и дешевле развернуть на различных устройствах, нежели модели больших форматов.
Как указывается в блоге компании, Phi-4 превосходит аналогичные и более крупные модели по качеству и точности выдаваемых ответов. В отдельности подчеркивается, что модель особенно хорошо справляется с решением математических задач благодаря использованию высококачественных синтетических и органических наборов данных, а также инновационных методов обучения.

Пример решения математической задачи с помощью Phi-4 / Источник: techcommunity.microsoft.com

Набор минусов у Phi-4 – стандартный для любой ИИ-модели: вероятность периодических «галлюцинаций» или слишком пространных ответов, в том числе из-за чересчур буквального понимания запросов.
Phi-4 выпущена в качестве превью-версии на платформе для разработчиков Azure AI Foundry от Microsoft – её использование на данный момент разрешено только по лицензии в исследовательских целях. Также инструмент планируют загрузить на Hugging Face.

Microsoft выпустила обновленную малую языковую модель Phi-4

Сравнение эффективности Phi-4 с другими моделями / Источник : techcommunity.microsoft.com

Источник: TechCrunch

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!