Восстание машин продолжается: научно-рекурсивный батл о способностях нейросетей.
Научная дискуссия вышла на новый уровень — теперь языковые модели сами пишут опровержения на критику в свой адрес. Разбираем трёхактную драму вокруг способности ИИ к логическим рассуждениям.
Предыстория конфликта
Всё началось с исследования Apple под названием "The Illusion of Thinking". Учёные компании провели серию экспериментов и пришли к неутешительному выводу:
хвалёные цепочки рассуждений , которые должны делать ИИ умнее, на деле работают плохо. При усложнении задач эффективность падает, а на элементарных примерах длинные рассуждения только вредят точности.
Казалось бы, обычная научная публикация. Но произошло неожиданное — языковая модель Claude Opus написала собственную статью-ответ. В работе "The Illusion of The Illusion of Thinking" ИИ раскритиковал методологию Apple, указав на серьёзные недочёты в дизайне экспериментов и поставив под сомнение достоверность результатов.
История получила продолжение: Gemini 2.5 Pro выпустил третью статью The Illusion of The Illusion of The Illusion of Thinking с мета-анализом всей дискуссии. Модель взвесила аргументы обеих сторон и вынесла свой вердикт.
Что выяснил Gemini после анализа
Третий участник дискуссии пришёл к компромиссным выводам:
- Критика Claude Opus частично справедлива — в экспериментах Apple действительно есть спорные моменты
- Однако даже с учётом всех поправок проблема остаётся: при росте сложности задач эффективность логических цепочек снижается
- Ситуация не настолько критична, как изображали исследователи Apple, но и не так радужна, как хотелось бы разработчикам ИИ
Практические выводы для индустрии
Эта академическая перепалка имеет вполне прикладное значение:
- Длинные логические цепочки — действительно слабое место современных языковых моделей. Это важно учитывать при разработке ИИ-продуктов для решения сложных аналитических задач.
- Стало очевидно: нужны более надёжные методики тестирования ИИ. Когда модели начинают оценивать собственные способности и критиковать исследования о себе, возникает очевидный конфликт интересов.
Уникально! Научный диспут между людьми и алгоритмами.
Учитывая, что дискуссия дошла до третьего раунда, есть надежда, что цикл взаимных опровержений наконец завершится. Иначе мы рискуем получить бесконечную рекурсию статей об "иллюзии иллюзии иллюзии", что вряд ли приблизит нас к пониманию реальных возможностей ИИ.