Топ-5 бесплатных моделей на OpenRouter в мае 2026
OpenRouter продолжает поддерживать бесплатный доступ к мощным языковым моделям, делая ИИ доступным для разработчиков и энтузиастов. Разберём пятёрку самых популярных бесплатных моделей по объёму использования и посмотрим, что у каждой под капотом.
1. Tencent Hy3 preview — 4,09 трлн токенов
Безусловный лидер по использованию. Mixture-of-Experts модель от Tencent с контекстом 262K токенов, заточенная под агентные сценарии и продакшен. Поддерживает три уровня рассуждений: отключённый, низкий и высокий — можно балансировать между скоростью и глубиной.
Плюсы: топ в академических, финансовых и юридических задачах, отличная генерация кода, огромный контекст. Минусы: preview-статус намекает на возможные изменения, меньше комьюнити-обкатки по сравнению с западными моделями.
2. NVIDIA Nemotron 3 Super — 587 млрд токенов
Гибридная Mamba-Transformer MoE архитектура: 120B параметров всего, но активны только 12B. Контекст до 1M токенов, multi-token prediction даёт +50% к скорости генерации против конкурентов.
Плюсы: рекордный контекст для долгих агентных задач, открытые веса и датасеты под NVIDIA Open License, сильные результаты на AIME 2025 и SWE-Bench. Минусы: в рейтингах категорий засветилась только в Trivia — пока узкое применение на практике.
3. Owl Alpha от OpenRouter — 222 млрд токенов
Foundation-модель с контекстом 1,05M токенов, нативной поддержкой tool use и совместимостью с Claude Code и OpenClaw. Сильна в маркетинге и юриспруденции
Плюсы: гигантский контекст, оптимизация под агентные задачи и автоматизацию workflow. Минусы: провайдер логирует промпты и ответы для улучшения модели — не подходит для чувствительных данных.
4. Poolside Laguna M.1 — 166 млрд токенов
Флагманская coding-модель от Poolside, занявшая 17-е место в категории Programming. Контекст 128K, до 8K токенов на выходе, fp8-квантизация для быстрого инференса.
Плюсы: заточка под сложные software engineering задачи, агентные coding-сценарии. Минусы: требует согласия с EULA Poolside, контекст скромнее лидеров списка, узкая специализация.
5. OpenAI gpt-oss-120b — 142 млрд токенов
Открытая MoE-модель от OpenAI: 117B параметров, 5,1B активных, запускается на одной H100. Поддерживает chain-of-thought, function calling, browsing и структурированный вывод.
Плюсы: настраиваемая глубина рассуждений, сильные позиции в финансах и SEO, репутация OpenAI. Минусы: контекст 131K заметно меньше, чем у Hy3 или Nemotron, требовательность к железу для self-hosting.
Что выбрать
Для агентных задач и максимального контекста — Hy3 preview или Nemotron 3 Super. Для кода — Laguna M.1. Для проверенной экосистемы — gpt-oss-120b. Если не хочется выбирать вручную, OpenRouter предлагает роутер openrouter/free, который сам подберёт модель под запрос.
Больше про LLM и AI — в нашем Telegram-канале (@devgeek_sh). Разбираем новые модели, делимся опытом и полезными находками.