Отчёт о состоянии ИИ по итогу 2025 года
Этот отчёт - это эмпирическое исследование реального использования LLM, основанное на анализе 100 триллионов токенов запросов, прошедших через платформу OpenRouter за ~2 года (фокус на 2024–2025).
Важно:
- они анализировали не текст запросов, а метаданные (модели, токены, категории, регионы, ретеншн и т.д.)
- это один из самых масштабных взглядов на то, как LLM реально используются в проде, а не в демо и бенчмарках
Ключевой перелом индустрии
Главный поворотный момент - декабрь 2024, релиз OpenAI o1 (reasoning model).
До этого:
- LLM работали как однопроходные автодополнители текста
- reasoning был имитацией (chain-of-thought, tool hints и т.п.)
После:
- появилось многошаговое внутреннее рассуждение
- модели начали реально планировать, проверять и итеративно улучшать ответы
- это стало фундаментом для agentic inference
Авторы называют это настоящей точкой бифуркации отрасли.
Open source vs proprietary
Общая картина
- Proprietary модели всё ещё доминируют
- Но open-source модели выросли до ~30% всего трафика
- Рост устойчивый, а не всплески "поиграться"
Китайские OSS
Особенно выделяются китайские open-source модели:
- DeepSeek
- Qwen
- Moonshot (Kimi)
Факты:
- Китайские OSS дошли до ~30% трафика в отдельные недели
- В среднем за год ~13%
- Конкурируют не только по цене, но и по качеству и скорости релизов
Вывод
Рынок пришёл к устойчивой дуальной модели:
- proprietary - надёжность, энтерпрайз, регуляторка
- OSS - цена, кастомизация, скорость, эксперименты
Большинство продакшен-стеков становятся мульти-модельными.
Кто лидирует среди open-source
Рынок OSS перестал быть монополией.
Раньше:
- DeepSeek контролировал >50% OSS трафика
Сейчас:
- ни одна модель не держит >20–25%
- рынок фрагментирован
- новые модели могут выйти с нуля на продакшен-уровень за недели
Топ по объёму токенов за год:
- DeepSeek
- Qwen
- Meta LLaMA
- Mistral
- GPT-OSS (OpenAI)
Размер модели и реальный спрос
Интересный инсайт: маленькие модели теряют спрос.
Категории:
- Small <15B - падают
- Medium 15–70B - растут быстрее всего
- Large >70B - стабильный спрос, но без монополии
Medium модели нашли product-market fit:
- достаточно умные
- дешевле и быстрее больших
- идеально подходят для продакшена
Формула рынка 2025:
- либо medium как "рабочая лошадка"
- либо самый мощный large для критичных задач
Для чего реально используют LLM
Open-source модели
Основные кейсы:
- Roleplay (исполнение ролей) и креатив - ~50%
- Программирование
- Переводы
- Общие вопросы
Почему roleplay так доминирует:
- меньше ограничений
- гибкость
- кастомизация
- фанфики, игры, диалоги, персонажи
Китайские OSS
Смещение в сторону:
- программирования
- технических задач
- инфраструктуры
То есть они перестают быть "чатами" и заходят в dev-сегмент.
Agentic inference - главный тренд
Это центральный вывод отчёта.
Что изменилось
LLM больше не:
- "один запрос - один ответ"
Теперь это:
- многошаговые цепочки
- инструменты
- состояние
- длинный контекст
- планирование
Факты
- >50% всех токенов уже идут через reasoning-модели
- tool-calling стабильно растёт
- средний prompt вырос: с ~1.5k до >6k токенов
- completion тоже вырос (за счёт reasoning)
Кто драйвит рост контекста
Программирование:
- большие кодовые базы
- диффы
- дебаг
- агенты
Программирование - главный use-case индустрии
- Доля programming выросла с ~11% до >50% всех токенов
- Anthropic (Claude) долго доминировал
- Сейчас: OpenAI усиливает позиции Google стабилен OSS догоняет MiniMax быстро растёт
Вывод:
Coding - самый конкурентный и стратегически важный сегмент LLM.
География
Распределение трафика:
- Северная Америка ~47%
- Азия ~29% (быстро растёт)
- Европа ~21%
Топ стран:
- США
- Сингапур
- Германия
- Китай
Языки:
- английский ~83%
- китайский ~5%
- дальше русский, испанский и др.
AI стал глобальной инфраструктурой, а не западным продуктом.
Ретеншн и эффект "Хрустальной туфельки"
Один из самых сильных концептов отчёта.
Наблюдение
- большинство пользователей постоянно мигрируют между моделями
- но есть небольшие когорты, которые остаются надолго
Объяснение
Авторы называют это Cinderella Glass Slipper Effect:
- у пользователя есть сложная, долго нерешаемая задача
- выходит новая модель
- она идеально "подходит" под этот workload
- возникает сильный lock-in
Это не ранние адоптеры, а те, у кого модель закрыла реальную боль.
Главный итог отчёта
- LLM usage стал: длинным сложным агентным встроенным в процессы
- Reasoning и tool-use - не фича, а стандарт
- Open-source - это уже не альтернатива, а равный игрок
- Программирование - ядро рынка
- Побеждают не самые умные модели, а те, кто: быстрее дешевле лучше вписываются в workflow
Больше постов у меня в Телеграм @corpent
#ai #llm #gpt #opensource #programming #агенты #product #tech