Новая реальность ИИ: меньше, лучше, дешевле
Привет, друзья! В этой статье мы хочтим поделиться с вами анализом свежего отчета от Стэнфордского университета, который показывает, как меняется ландшафт технологий ИИ в 2025 году. Особенно интересно, что 2024 год стал переломным для компактных моделей, которые теперь способны конкурировать с гигантами индустрии.
Эра новых возможностей
Согласно ежегодному отчету Института искусственного интеллекта с человекоцентричным подходом Стэнфордского университета, гонка ИИ-технологий стремительно набирает обороты. Ключевые результаты исследования указывают на две важные тенденции: рост числа и качества китайских ИИ-моделей, бросающих вызов американскому лидерству, и сокращение разрыва в производительности между ведущими моделями.
Отчет подчеркивает, что никакой отдельной компании не удаётся занять доминирующую позицию, несмотря на быстрое совершенствование технологий. Если в начале 2024 года разница между первой и десятой моделью на Chatbot Arena Leaderboard (рейтинге, где пользователи оценивают качество чат-ботов) составляла около 12%, то к началу 2025 года этот разрыв сократился до всего 5%.
«Передовой фронт становится всё более конкурентным и всё более многолюдным», — отмечается в докладе.
Меньше — значит лучше
Хотя ведущие генеративные модели ИИ в среднем становятся крупнее (используют больше параметров, вычислительных мощностей и более объемные наборы данных для обучения), разработчики доказывают, что небольшие, оптимизированные модели способны на впечатляющие результаты.
Благодаря совершенствованию алгоритмов, современная компактная модель может сравниться по производительности с моделью, которая два года назад была в 100 раз больше. «2024 год стал прорывным для небольших моделей ИИ», — утверждает индекс.
Барт Селман, специалист по информатике из Корнельского университета, считает положительным знаком то, что относительно скромные проекты, такие как китайский DeepSeek, демонстрируют конкурентоспособность.
«Я предполагаю, что мы увидим, как небольшие команды из пяти или даже двух человек придут с новыми алгоритмическими идеями, которые перевернут индустрию, — говорит он. — И это хорошо. Мы не хотим, чтобы миром управляли только крупные корпорации».
Промышленность vs. наука
Отчет показывает кардинальное изменение в источниках инноваций: если до 2006 года индустрия создавала менее 20% заметных моделей ИИ, то в 2023 году этот показатель вырос до 60%, а в 2024 году составил почти 90%. Это полный разворот ситуации по сравнению с началом 2000-х, когда нейросети и генеративный ИИ еще не получили широкого распространения.
США продолжают лидировать по количеству выпущенных значимых моделей (40 в 2024 году), за ними следуют Китай (15) и Европа (3). Однако к соревнованию присоединяются и другие регионы, включая Ближний Восток, Латинскую Америку и Юго-Восточную Азию.
Китай догоняет
Примечательно, что прежнее лидерство США в качестве моделей практически исчезло. Китай, лидирующий по количеству публикаций и патентов в области ИИ, теперь разрабатывает модели, не уступающие американским конкурентам.
Если в 2023 году лучшие китайские модели отставали от ведущей американской на 20 процентных пунктов по тесту MMLU (Massive Multitask Language Understanding), то к концу 2024 года это преимущество сократилось до 0,3 процентных пункта.
«Примерно в 2015 году Китай поставил перед собой цель стать лидером в области ИИ и добивался этого через инвестиции в образование, — отмечает Селман. — Сейчас мы видим, что эта стратегия начинает приносить плоды».
Открытость набирает силу
Еще одна важная тенденция — рост числа и эффективности моделей с «открытыми весами», таких как DeepSeek и LLaMa от Meta. В этих моделях пользователи могут свободно просматривать параметры, которые модели изучают во время обучения, хотя другие детали, например, код обучения, могут оставаться закрытыми.
Изначально закрытые системы, в которых ни один из этих факторов не раскрывается, имели явное преимущество, но разрыв в производительности между лидерами в этих категориях сократился с 8% в начале 2024 года до всего 1,7% в начале 2025 года.
«Это, безусловно, хорошо для всех, кто не может позволить себе создать модель с нуля, а таких много — малые компании и академические исследователи», — говорит Рэй Перро, специалист по информатике из SRI и содиректор отчета.
Компания OpenAI, создатель ChatGPT, планирует выпустить модель с открытыми весами в ближайшие месяцы.
Эффективность вместо размера
После запуска ChatGPT в 2022 году разработчики сосредоточили свои усилия на улучшении систем путем их увеличения. Эта тенденция сохраняется: энергия, используемая для обучения типичной ведущей модели ИИ, в настоящее время удваивается ежегодно; объем вычислительных ресурсов, используемых для одной модели, удваивается каждые пять месяцев; а наборы данных для обучения удваиваются в размере каждые восемь месяцев.
Однако компании также выпускают очень эффективные маленькие модели. Например, самая маленькая модель, набравшая более 60% на тесте MMLU в 2022 году, использовала 540 миллиардов параметров; к 2024 году модель достигла того же результата, используя всего 3,8 миллиарда параметров.
Небольшие модели обучаются быстрее, дают более быстрые ответы и потребляют меньше энергии, чем более крупные. «Это улучшает все аспекты работы», — говорит Перро.
По словам Селмана, некоторые меньшие модели могут эмулировать поведение более крупных или использовать лучшие алгоритмы и оборудование, чем в старых системах. Индекс сообщает, что средняя энергоэффективность оборудования, используемого системами ИИ, улучшается примерно на 40% в год.
В результате таких достижений стоимость достижения результата чуть выше 60% на тесте MMLU резко снизилась: с примерно 20 долларов США за миллион токенов (фрагментов слов, производимых языковыми моделями) в ноябре 2022 года до 7 центов за миллион токенов в октябре 2024 года.
Проблемы остаются
Несмотря на поразительные улучшения по нескольким распространенным тестам, индекс подчеркивает, что генеративный ИИ по-прежнему страдает от таких проблем, как неявная предвзятость и склонность к «галлюцинациям» — генерации ложной информации.
«Они впечатляют меня во многих отношениях, но и ужасают в других, — говорит Селман. — Удивляют тем, что допускают очень базовые ошибки».
Мнение Sherpa Robotics
В Sherpa Robotics мы внимательно следим за этими тенденциями и считаем, что эра "малых, но мощных" моделей открывает огромные возможности для инноваций в искусственном интеллекте. Наша команда уже активно интегрирует компактные модели ИИ в свои решения.