Прорывы языковых моделей в математике стали возможны благодаря архитектуре «рассуждений» — FT

Издание поговорило с математиками и специалистами OpenAI.

Скриншот из перечня Эрдёша со страницы задачи №281, которая помечена как «доказанная с помощью ChatGPT»
Скриншот из перечня Эрдёша со страницы задачи №281, которая помечена как «доказанная с помощью ChatGPT»
  • В 2025 году экспериментальные версии моделей от OpenAI и Google получили «золотые медали» за решение пяти из шести задач на Международной математической олимпиаде (IMO). Это не самый высокий результат — среди участников-людей были те, кто решил все. А на Международной олимпиаде по программированию (ICPC) «рассуждающая» система от OpenAI справилась лучше официальных победителей.
  • В январе 2026-го GPT-5.2 Pro вывела новое, ранее не опубликованное решение одной из задач Эрдёша. Это событие лауреат Филдсовской премии по математике Теренс Тао назвал самым «недвусмысленным» примером математического открытия с помощью ИИ-модели.
  • До этого исследователи считали, что большие языковые модели плохо справляются с вычислениями, потому что это просто вероятностные системы, которые предсказывают следующее слово в предложении, а в математике нужна точность, пишет Financial Times. Также нейросетям не хватало «способности к абстрактному мышлению, выявлению закономерностей и использованию логики».
  • Переломным моментом издание называет появление «рассуждающих» нейросетей. Первую подобную модель o1 с архитектурой «мышления» представила компания OpenAI в 2024 году. Она позволила решать задачи шаг за шагом, «отслеживать ошибки и перепроверять ответы».
  • «Мы прошли путь от тестов, когда определяли, может ли ИИ отличить кошек от собак, до математических задач исследовательского уровня», — сказала изданию бывший член совета директоров OpenAI и временный исполнительный директор Центра безопасности и новых технологий Джорджтаунского университета и Хелен Тонер.
  • Но чат-ботам ещё далеко до того, чтобы самостоятельно решать сложные задачи, на которые у исследователей уходят «недели или годы», говорит научный сотрудник OpenAI Себастьян Бубек. Человек всё равно «направляет» модель и делает заметки. Для «автономного» решения потребуется «непрерывное обучение», считает он.
4
4 комментария