Отчёт о состоянии ИИ по итогу 2025 года

Этот отчёт - это эмпирическое исследование реального использования LLM, основанное на анализе 100 триллионов токенов запросов, прошедших через платформу OpenRouter за ~2 года (фокус на 2024–2025).

Важно:

  • они анализировали не текст запросов, а метаданные (модели, токены, категории, регионы, ретеншн и т.д.)
  • это один из самых масштабных взглядов на то, как LLM реально используются в проде, а не в демо и бенчмарках

Ключевой перелом индустрии

Главный поворотный момент - декабрь 2024, релиз OpenAI o1 (reasoning model).

До этого:

  • LLM работали как однопроходные автодополнители текста
  • reasoning был имитацией (chain-of-thought, tool hints и т.п.)

После:

  • появилось многошаговое внутреннее рассуждение
  • модели начали реально планировать, проверять и итеративно улучшать ответы
  • это стало фундаментом для agentic inference

Авторы называют это настоящей точкой бифуркации отрасли.

Open source vs proprietary

Общая картина

  • Proprietary модели всё ещё доминируют
  • Но open-source модели выросли до ~30% всего трафика
  • Рост устойчивый, а не всплески "поиграться"

Китайские OSS

Особенно выделяются китайские open-source модели:

  • DeepSeek
  • Qwen
  • Moonshot (Kimi)

Факты:

  • Китайские OSS дошли до ~30% трафика в отдельные недели
  • В среднем за год ~13%
  • Конкурируют не только по цене, но и по качеству и скорости релизов

Вывод

Рынок пришёл к устойчивой дуальной модели:

  • proprietary - надёжность, энтерпрайз, регуляторка
  • OSS - цена, кастомизация, скорость, эксперименты

Большинство продакшен-стеков становятся мульти-модельными.

Кто лидирует среди open-source

Рынок OSS перестал быть монополией.

Раньше:

  • DeepSeek контролировал >50% OSS трафика

Сейчас:

  • ни одна модель не держит >20–25%
  • рынок фрагментирован
  • новые модели могут выйти с нуля на продакшен-уровень за недели

Топ по объёму токенов за год:

  • DeepSeek
  • Qwen
  • Meta LLaMA
  • Mistral
  • GPT-OSS (OpenAI)

Размер модели и реальный спрос

Интересный инсайт: маленькие модели теряют спрос.

Категории:

  • Small <15B - падают
  • Medium 15–70B - растут быстрее всего
  • Large >70B - стабильный спрос, но без монополии

Medium модели нашли product-market fit:

  • достаточно умные
  • дешевле и быстрее больших
  • идеально подходят для продакшена

Формула рынка 2025:

  • либо medium как "рабочая лошадка"
  • либо самый мощный large для критичных задач

Для чего реально используют LLM

Open-source модели

Основные кейсы:

  1. Roleplay (исполнение ролей) и креатив - ~50%
  2. Программирование
  3. Переводы
  4. Общие вопросы

Почему roleplay так доминирует:

  • меньше ограничений
  • гибкость
  • кастомизация
  • фанфики, игры, диалоги, персонажи

Китайские OSS

Смещение в сторону:

  • программирования
  • технических задач
  • инфраструктуры

То есть они перестают быть "чатами" и заходят в dev-сегмент.

Agentic inference - главный тренд

Это центральный вывод отчёта.

Что изменилось

LLM больше не:

  • "один запрос - один ответ"

Теперь это:

  • многошаговые цепочки
  • инструменты
  • состояние
  • длинный контекст
  • планирование

Факты

  • >50% всех токенов уже идут через reasoning-модели
  • tool-calling стабильно растёт
  • средний prompt вырос: с ~1.5k до >6k токенов
  • completion тоже вырос (за счёт reasoning)

Кто драйвит рост контекста

Программирование:

  • большие кодовые базы
  • диффы
  • дебаг
  • агенты

Программирование - главный use-case индустрии

  • Доля programming выросла с ~11% до >50% всех токенов
  • Anthropic (Claude) долго доминировал
  • Сейчас: OpenAI усиливает позиции Google стабилен OSS догоняет MiniMax быстро растёт

Вывод:

Coding - самый конкурентный и стратегически важный сегмент LLM.

География

Распределение трафика:

  • Северная Америка ~47%
  • Азия ~29% (быстро растёт)
  • Европа ~21%

Топ стран:

  • США
  • Сингапур
  • Германия
  • Китай

Языки:

  • английский ~83%
  • китайский ~5%
  • дальше русский, испанский и др.

AI стал глобальной инфраструктурой, а не западным продуктом.

Ретеншн и эффект "Хрустальной туфельки"

Один из самых сильных концептов отчёта.

Наблюдение

  • большинство пользователей постоянно мигрируют между моделями
  • но есть небольшие когорты, которые остаются надолго

Объяснение

Авторы называют это Cinderella Glass Slipper Effect:

  • у пользователя есть сложная, долго нерешаемая задача
  • выходит новая модель
  • она идеально "подходит" под этот workload
  • возникает сильный lock-in

Это не ранние адоптеры, а те, у кого модель закрыла реальную боль.

Главный итог отчёта

  1. LLM usage стал: длинным сложным агентным встроенным в процессы
  2. Reasoning и tool-use - не фича, а стандарт
  3. Open-source - это уже не альтернатива, а равный игрок
  4. Программирование - ядро рынка
  5. Побеждают не самые умные модели, а те, кто: быстрее дешевле лучше вписываются в workflow

Больше постов у меня в Телеграм @corpent
#ai #llm #gpt #opensource #programming #агенты #product #tech

1
Начать дискуссию