Дебют Phi-2: вызов доминированию традиционных моделей искусственного интеллекта

Microsoft Phi-2 SML, несмотря на свой небольшой размер (2,7 миллиарда параметров), превосходит более крупные модели в таких задачах, как рассуждение и решение физических задач.

Дебют Phi-2: вызов доминированию традиционных моделей искусственного интеллекта

Microsoft Research представила свою модель малого языка Phi-2 (SML), заявив, что она обеспечивает исключительную производительность, несмотря на ее относительно небольшой размер. Модель Phi-2 содержит 2,7 миллиарда параметров — масштаб, позволяющий ей работать на оборудовании потребительского уровня, таком как ноутбуки или мобильные устройства. Говорят, что его производительность может конкурировать с гораздо более крупными моделями, такими как Llama 2-7B и Mistral-7B компании Meta , обе с 7 миллиардами параметров.

Больше новостей в TG канале

Масштабный подход с уменьшенной предвзятостью

По результатам тестов Phi-2 превзошел даже последнюю модель Google Gemini Nano 2 , у которой на полмиллиарда больше параметров. Кроме того, Microsoft Research утверждает, что Phi-2 демонстрирует меньше случаев предвзятых или «токсичных» ответов по сравнению с моделью Llama 2. Исследователи полагают, что достижение такого баланса эффективности и снижения предвзятости может существенно повлиять на будущее внедрение ИИ в различных реальных сценариях.
Более того, компактность Phi-2, похоже, не ставит под угрозу его способности решать проблемы, о чем свидетельствует производительность Phi-2 при решении физических задач, которая ранее была продемонстрирована Google для его модели Gemini Ultra. Несмотря на меньший размер Фи-2, он правильно ответил и помог исправить ошибки учащихся в вопросе по физике, что свидетельствует о расширенных возможностях понимания модели. Phi-2 появился всего через несколько месяцев после того, как Microsoft представила Phi 1.5 в сентябре.

Лицензионные ограничения

Несмотря на многообещающие достижения, представленные Phi-2, остается заметный барьер на пути его широкого внедрения. В настоящее время модель лицензируется исключительно для исследовательских целей в соответствии с лицензией Microsoft Research License , которая ограничивает ее использование некоммерческой, не приносящей доход исследовательской деятельностью. Пока условия лицензирования не будут расширены, предприятия, желающие использовать Phi-2 для разработки продуктов или коммерческих проектов, не смогут этого сделать.

Поскольку исследования Microsoft продолжают расширять границы того, чего могут достичь небольшие языковые модели, это указывает на смену парадигмы, в которой более компактный ИИ может выполнять задачи, ранее предназначенные для его более крупных аналогов, что обеспечивает более широкое применение и интеграцию в средах с низким энергопотреблением.

11
2 комментария

Почему бы не использовать традиционные модели искусственного интеллекта, если они работают хорошо?

3
Ответить

Интересный взгляд на будущее искусственного интеллекта!

1
Ответить