Сможет ли Китай обогнать США в гонке за ИИ-лидерство
2024 год стал переломным для китайского ИИ-рынка. После успеха DeepSeek китайцы перестают быть догоняющими. Аналитическое агентство Artificial Analysis сравнило уровень интеллектуальных способностей американских и китайских ИИ-моделей на бенчмарках MMLU, GPQA Diamond, MATH-500 и HumanEval. Далее – краткий обзор китайских ИИ-моделей.
Выпущено уже 7 передовых рассуждающих моделей: Alibaba (QwQ), ByteDance (Doubao 1.5 Pro), MoonShot (Kimi k1.5), Stepfun (Step-R-mini), Zhipu (GLM-Zero-Preview), Baichuan (M1-Preview) и DeepSeek (R1).
Китайские участники глобальной ИИ-гонки
- Бигтехи: Alibaba, Baidu, ByteDance, Huawei, Tencent.
- Стартапы: MiniMax, Moonshot AI, 01·AI, DeepSeek, Zhipu, Baichuan, Stepfun.
Рассуждающие модели есть у всех, кроме 01·AI и MiniMax. При этом DeepSeek затмил не только OpenAI, но и китайские гиганты – Alibaba и ByteDance. Отставание китайцев стало несущественным, особенно в сегменте рассуждающих моделей. Ниже хронология событий.
Начало гонки
- В конце 2023 г. китайские LLM (например, Alibaba Qwen Chat 7B) значительно уступали GPT-3.5 Turbo.
- К началу 2024 г. Alibaba представила Qwen Chat 72B, которая превзошла GPT-3.5, но все еще отставала от GPT-4, особенно в мультимодальности.
Прорыв китайских моделей
- Летом 2024 г. DeepSeek V2 стала лидером среди китайских LLM, но еще отставала от GPT-4o.
- В сентябре 2024 г. Alibaba Qwen 2.5 Instruct 72B сравнялась с GPT-4o, а по некоторым задачам даже превзошла ее.
- В ответ OpenAI выпустила o1-preview, совершив первый за 1,5 года прорыв в эффективности.
Ожесточенная конкуренция
- В декабре 2024 г. DeepSeek V3 превзошла GPT-4o, но уступила обновленной o1 от OpenAI.
- В январе 2025 г. DeepSeek R1 стала первой китайской моделью, приблизившейся к лидерству, но через две недели OpenAI выпустила o3, вновь вырвавшись вперед.
Эмбарго на чипы и его влияние
- С 2022 г. США начали вводить жесткие ограничения на экспорт чипов Nvidia в Китай.
- После запрета на экспорт в Китай моделей H100 и A100, компания представила версии H800 и A800 с ограниченной пропускной способностью.
- Однако в октябре 2023 г. экспорт этих моделей также был запрещен США.
- Несмотря на санкции, китайские компании адаптировались, используя менее мощные чипы (например, H20 с 148 TFLOPs против H100 с 989 TFLOPs).
- Китай развивает LLM быстрее США, имея значительно меньше вычислительных мощностей.
Текущее состояние и прогнозы
- Китай вышел на паритет с США осенью 2024 г., но OpenAI сохраняет лидерство благодаря быстрым инновациям.
- Китайские компании, такие как DeepSeek, Alibaba, Moonshot, StepFun, Zhipu и другие, уже имеют 11 моделей, сопоставимых или превосходящих GPT-4o.
- К концу 2025 г. Китай может стать лидером в гонке LLM, особенно с учетом замедления темпов у Google (Gemini 2.0 Pro) и других американских компаний. Например, последняя модель OpenAI GPT-4.5 не показала ничего принципиально нового, кроме завышенной цены.
Лидеры среди китайских стартапов
Помимо DeepSeek на китайском рынке есть и другие перспективные стартапы. Массачусетский технологический институт (MIT) выделил 4 перспективные компании:
Stepfun основан бывшим вице-президентом Microsoft. Выпустил 11 мультимодальных моделей, включая Step-2 с 1 трлн параметров. Для сравнения: у GPT-4 их около 1,8 трлн.
ModelBest специализируется на малых языковых моделях, которые работают на устройствах в реальном времени. Его последняя модель MiniCPM соответствует производительности GPT-3.5.
Zhipu разрабатывает модели уровня GPT-4 (GLM-4-Plus) и видеогенератор Ying, аналогичный Sora от OpenAI. Компания также разработала модель GLM-4V-Plus, которая может просматривать веб-страницы и анализировать видео.
Infinigence AI решает проблему нехватки чипов, объединяя архитектуры разных производителей, что сокращает время обучения моделей на 30%. Стартап также предлагает облачную платформу Infini-AI для разработки и развертывания моделей.
Выводы
Американским компаниям придется очень постараться, чтобы не утратить лидерства в ИИ. Техгиганты планируют более $320 млрд на ИИ в этом году. Инвестиции в ИИ 4 крупнейших технологических компаний (AGMM) выросли на 63% в прошлом году и снова вырастут в 2025 г. Гонка продолжается.
Больше аналитики в моем Telegram-канале. Пишу об экономике, обществе и технологиях в России и мире.