Конец эпохи "параметров": как система проектирования переопределяет будущее ИИ

Когда в январе 2026 года GPT-5.2 впервые превзошла среднего человека в тесте общего интеллекта, казалось, что наступил момент истины для искусственного интеллекта. Но настоящий переворот произошел позже — когда небольшая стартап-компания Poetiq показала, что можно удвоить возможности лучших моделей без их переобучения. Это открытие стало поворотной точкой, обозначившей конец одной эры в AI и начало совершенно иной.

Бенчмарк ARC-AGI-2: тест, который не обманешь

Чтобы понять масштаб происходящего, нужно разобраться с самим бенчмарком. ARC-AGI-2 (Abstraction and Reasoning Corpus for Artificial General Intelligence-Version 2) был создан командой Франсуа Холе в 2025 году и представляет собой кардинально новый подход к оценке интеллекта.

В отличие от традиционных тестов, которые часто становятся жертвами переобучения и "натаскивания", ARC-AGI-2 работает по принципу полной новизны. Каждый вопрос — это абсолютно неизвестная абстрактная задача. Нет тренировочного набора данных, нет подготовки. AI должна понять правила, глядя на несколько примеров, перенести полученные знания и завершить логическую цепочку рассуждений точно так же, как это сделал бы человек.

Это означает, что модель, полагающаяся только на запомненные паттерны или статистические закономерности, безнадежно провалится. Тест специально разработан для проверки "настоящего общего интеллекта" — способности к подлинному обобщению и рассуждению, а не к воспроизведению выученного.

Момент, который переменил все

Когда OpenAI объявила, что GPT-5.2 достигла 60% точности в ARC-AGI-2 (человеческий средний показатель), это было значительным достижением. Казалось, вершина достигнута. Но произошло нечто неожиданное.

Стартап Poetiq, использовав GPT-5.2 как основу, создал систему под названием Poetiq (GPT-5.2X-High), которая показала результат в 75% — на 15 пунктов выше человеческого среднего. И это без переобучения модели, без добавления новых параметров, без увеличения вычислительных мощностей.

Как они это сделали? Ответ элегантен и неочевиден: сложная архитектура программного обеспечения, которая автоматически координирует, комбинирует и направляет существующие большие языковые модели через сложные процессы рассуждения. Стоимость — менее $8 за вопрос. Результат — революция.

Для сравнения: Gemini3 Deep Think, система от Google, которая специально разработана для "глубокого мышления", получила только 46% с гораздо более высокими затратами. Разница поразительна.

От параметров к системному дизайну

Это достижение раскрывает фундаментальную истину, которую индустрия начинает осознавать: следующий уровень развития AI находится не в области увеличения вычислительных мощностей и количества параметров, а в системном проектировании и сотрудничестве человека и машины.

Несколько лет подряд прогресс в AI измерялся просто: больше параметров = лучше результаты. Компании вкладывали миллиарды в возведение все более мощных моделей, строя свои стратегии на предположении, что масштаб решает все. Но эта логика достигла своих пределов.

GPT-5.2 уже обладает способностями уровня докторской степени во множестве профессиональных областей. Она лучше среднего эксперта в 44 различных профессиональных задачах. Проблема в том, что этот колоссальный потенциал часто остается неиспользованным.

Проблема "избыточных возможностей"

OpenAI недавно официально объявила о концепции "capability overhang" — "избытке возможностей". Это означает, что современные большие модели могут делать намного больше, чем люди на самом деле их используют.

Компании покупают доступ к AI, но фактически используют его как продвинутую поисковую систему. Университеты имеют доступ к инструментам, которые могут написать диссертацию, но применяют их только для редактирования текстов. Медицинские учреждения могут использовать AI для диагностики, но используют ее только для документирования.

"Настоящее предложение не в том, что AI недостаточно сильна," — говорит сообщество специалистов. "Реальная проблема в том, что организации неохотно меняют свои процессы."

Это наблюдение переворачивает весь нарратив о будущем AI. Бутылочное горло находится не в модели — оно находится в людях. В их способности переосмыслить рабочие процессы, переработать системы и переучить команды для работы с новой реальностью.

Стратегический разворот 2026 года

Понимая это, OpenAI объявила о своей стратегии на 2026 год. Компания инвестирует огромные ресурсы не в создание еще больших моделей, а в системную интеграцию для медицины, бизнеса и повседневной жизни. Ключевые направления — "обучение людей использованию AI" и "встраивание AI в существующие процессы".

Успех Poetiq доказывает, что с отличным системным проектированием потенциал существующих моделей можно удвоить. Это означает, что конкурентное преимущество в 2026 году и далее будет принадлежать не компаниям с самыми большими моделями, а компаниям, которые лучше всех смогут интегрировать AI в ткань человеческой деятельности.

Победители нового мира

В 2025 году поле боя было ясно: это была гонка вычислительных мощностей. Компания с самыми большими моделями, самым лучшим доступом к данным и самыми большими бюджетами выигрывала.

Но в 2026 году правила меняются. Победители будут теми, кто:

**Понимает domain-specific knowledge.** Просто применить GPT-5.2 к проблеме в кардиологии недостаточно. Нужно понимать особенности медицинской практики, регуляторные требования, этические вопросы. Системы, которые учитывают эти нюансы, значительно превосходят просто "мощные" системы.

**Проектирует рабочие процессы вокруг AI.** Компании, которые переосмыслят свои внутренние процессы специально для работы с AI, получат экспоненциальный выигрыш. Это не просто замена человека на машину — это переопределение того, как работает процесс.

**Инвестирует в систему, а не только в модель.** Poetiq создала ценность не благодаря новой модели, а благодаря тому, как она согласовала существующие модели. Такой подход масштабируется быстрее и дешевле, чем переобучение.

**Создает человеко-машинные симбиозы.** Будущее не за полной автоматизацией, а за интеграцией. Человеческие навыки творчества, интуиции и суждения в сочетании с вычислительной мощностью AI создают систему, превосходящую обе части в отдельности.

Заключение: конец одной эры, начало другой

Когда GPT-5.2 превзошла человеческий уровень на ARC-AGI-2, это был важный момент, но не финальный. Когда Poetiq достигла 75% точности, переупаковав существующие возможности через лучший системный дизайн, это оказалось гораздо более значимым сигналом.

Эпоха, когда прогресс в AI измерялся только параметрами и вычислительной мощностью, подходит к концу. Начинается эпоха системного проектирования, процессной инженерии и человеко-машинного симбиоза.

GPT-5.2 не просто какая-то модель среди моделей. Это символ переходного момента. Момента, когда индустрия осознала, что технология уже достаточно мощна. Теперь главное — найти способы позволить людям и организациям действительно использовать эту мощь.

Победителем нового десятилетия AI станет не компания, которая создаст самую большую модель, а компания, которая лучше всех ткет AI в ткань человеческой жизни.

1
Начать дискуссию