Модель OpenAI впервые достигла результата уровня золотой медали на Международной математической олимпиаде
Расскажу, что это была за модель, как отреагировали ученые, достижение ли это и были ли они первыми (спойлер - нет). И в чем тут интрига.
🔥 Еще больше интересного в моем канале продуктовые штучки
Что произошло?
Это самая престижной олимпиаде для школьников по математике в мире. Модель правильно решила 5 из 6 задач соревнования IMO-2025, набрав 35 из 42 баллов, что по официальной шкале соответствует «золоту» — результату, которого достигает только 10–11% лучших участников-людей.
Задачи IMO-2025 были предложены модели в условиях, максимально приближённых к человеческим: никаких внешних подсказок, только текст задач и требование оформить доказательств.
Ответы были рассмотрены и оценивались независимыми бывшими призёрами IMO, которые вынесли вердикт по каждой работе; сравнивали строго по официальным критериям и анонимно.
5 из 6 задач — полностью или почти полностью решены, одна задача осталась без решения. Но этого хватило для попадания в высшую «золотую» категорию. Вот тут решение
Почему это важно?
IMO — чрезвычайно сложное соревнование: участники решают по три задачи, задания требуют не только владения школьной математикой, но и творческого мышления, изложения строгих доказательств и поиска неожиданных подходов.
Прорыв в математической креативности ИИ показывает, что языковые модели выходят за пределы простого воспроизведения текстов: они способны к многочасовому продуманному рассуждению и созданию новых математических доказательств.
Это событие серьёзно ускоряет ожидания в развитии искусственного интеллекта: достижения, которые казались «делом многих лет», стали реальностью уже сейчас.
Что это за модель?
Модель не имеет публичного названия и является прототипом, отличающимся от GPT-4 и будущего GPT-5: даже в релизе GPT-5 подобных математиеских возможностей не ожидается.
Модель относится к LLM нового поколения, отличающаяся улучшенными механизмами рассуждения и способностью держать «в уме» очень длинные цепочки логических шагов — вплоть до написания многостраничных строгих математических доказательств.
Она не заточена только под математику, это именно универсальная рассуждающая LLM, опирающаяся на методы обучения с подкреплением и масштабированное использование вычислительных ресурсов. Это делает успех особенно впечатляющим.
По словам разработчиков, модель «долго думает»: для решения задач ей требуется гораздо больше вычислительных ресурсов и времени, чем для стандартных запросов к LLM, что подчеркивает особую сложность заданий олимпиады.
Пока что эта модель не предназначена для публичного использования. OpenAI обещает, что похожие возможности станут доступны не раньше, чем через несколько месяцев.
Как отреагировали на достижение?
Участники ИИ-сообщества, математики и даже известные скептики признали это достижение «по-настоящему впечатляющим», особенно учитывая универсальность подхода.
Ряд экспертов осторожно подчёркивает важность независимой верификации результатов, так как официальная IMO пока непосредственно свои итоги не подтверждала.
А что другие модели?
Для сравнения, даже лучшие коммерческие ИИ (Gemini, Grok и др.) в 2025 году не смогли решить задачи IMO даже на уровень бронзы
Это первый раз, когда ИИ-система выигрывает золото — в прошлом году две системы от Google, AlphaProof и AlphaGeometry 2, совместно выиграли серебро, решив 4 задачи.
Это первый раз, когда ИИ выигрывает золото: в прошлом году две системы от Google, AlphaProof и AlphaGeometry 2, совместно выиграли серебро, решив 4 задачи.
Любопытно, что модель Google DeepMind тоже решила задачи на золото в этом году. Причем узнали Google об этом в пятницу днем (новость от OpenAI же вышла только в субботу примерно в час ночи).
Но пришлось ждать одобрения маркетинга. Поэтому OpenAI объявили о своем достижении раньше
upd. На 22 июня появилась инфо, что Google ждал официальной оценки результатов от организаторов IMO и объявил о результате только после того, как олимпиада завершилась и участники-школьники получили свои награды. Это было сделано из уважения к подросткам и правилам олимпиады.
OpenAI объявила о успехе раньше, вскоре после итогов конкурса, что вызвало критику со стороны Google. Главная претензия — результат OpenAI не был официально подтвержден оценщиками IMO.
OpenAI в ответ на это заявляет о том, что привлекли сторонних экспертов для проверки (их работу оценивали три бывших призёра IMO, знакомых с системой оценивания).
IMO официальных комментариев не дала.