Яндекс представил технические детали новых моделей Alice AI
Яндекс поделился первыми техническими подробностями нового семейства моделей Alice AI. Модель тестировали и улучшали на основе тысяч реальных пользовательских задач, и в процессе обучения она превзошла DeepSeek. Разработчики обещают опубликовать подробный технический отчёт позже.
Подробнее на Хабре:
Новая Alice AI LLM получила не только качественные, но и архитектурные улучшения: разработчики перешли на MoE (Mixture of Experts). При обучении применялся метод online-RL с подкреплением с многокомпонентными наградами, что считается сложной задачей.
Кроме того, новую LLM объединили с генеративным поиском в новый пайплайн. Это позволяет нейросети использовать для ответа не только текст, но и другие данные: изображения, карточки организаций, карты, видео. Теперь LLM может последовательно отправлять запросы в сеть, чтобы собрать всю необходимую информацию.
Ожидаем публикации подробного технического отчёта и поздравляем команду Alice AI с успехом в App Store.