Модель OpenAI впервые достигла результата уровня золотой медали на Международной математической олимпиаде

Расскажу, что это была за модель, как отреагировали ученые, достижение ли это и были ли они первыми (спойлер - нет). И в чем тут интрига.

🔥 Еще больше интересного в моем канале продуктовые штучки

Это самая престижной олимпиаде для школьников по математике в мире. Модель правильно решила 5 из 6 задач соревнования IMO-2025, набрав 35 из 42 баллов, что по официальной шкале соответствует «золоту» — результату, которого достигает только 10–11% лучших участников-людей.

Задачи IMO-2025 были предложены модели в условиях, максимально приближённых к человеческим: никаких внешних подсказок, только текст задач и требование оформить доказательств.

Ответы были рассмотрены и оценивались независимыми бывшими призёрами IMO, которые вынесли вердикт по каждой работе; сравнивали строго по официальным критериям и анонимно.

5 из 6 задач — полностью или почти полностью решены, одна задача осталась без решения. Но этого хватило для попадания в высшую «золотую» категорию. Вот тут решение

IMO — чрезвычайно сложное соревнование: участники решают по три задачи, задания требуют не только владения школьной математикой, но и творческого мышления, изложения строгих доказательств и поиска неожиданных подходов.

Прорыв в математической креативности ИИ показывает, что языковые модели выходят за пределы простого воспроизведения текстов: они способны к многочасовому продуманному рассуждению и созданию новых математических доказательств.

Это событие серьёзно ускоряет ожидания в развитии искусственного интеллекта: достижения, которые казались «делом многих лет», стали реальностью уже сейчас.

Модель не имеет публичного названия и является прототипом, отличающимся от GPT-4 и будущего GPT-5: даже в релизе GPT-5 подобных математиеских возможностей не ожидается.

Модель относится к LLM нового поколения, отличающаяся улучшенными механизмами рассуждения и способностью держать «в уме» очень длинные цепочки логических шагов — вплоть до написания многостраничных строгих математических доказательств.

Она не заточена только под математику, это именно универсальная рассуждающая LLM, опирающаяся на методы обучения с подкреплением и масштабированное использование вычислительных ресурсов. Это делает успех особенно впечатляющим.

По словам разработчиков, модель «долго думает»: для решения задач ей требуется гораздо больше вычислительных ресурсов и времени, чем для стандартных запросов к LLM, что подчеркивает особую сложность заданий олимпиады.

Пока что эта модель не предназначена для публичного использования. OpenAI обещает, что похожие возможности станут доступны не раньше, чем через несколько месяцев.

Участники ИИ-сообщества, математики и даже известные скептики признали это достижение «по-настоящему впечатляющим», особенно учитывая универсальность подхода.

Ряд экспертов осторожно подчёркивает важность независимой верификации результатов, так как официальная IMO пока непосредственно свои итоги не подтверждала.

Модель OpenAI впервые достигла результата уровня золотой медали на Международной математической олимпиаде

Для сравнения, даже лучшие коммерческие ИИ (Gemini, Grok и др.) в 2025 году не смогли решить задачи IMO даже на уровень бронзы

Это первый раз, когда ИИ-система выигрывает золото — в прошлом году две системы от Google, AlphaProof и AlphaGeometry 2, совместно выиграли серебро, решив 4 задачи.

Это первый раз, когда ИИ выигрывает золото: в прошлом году две системы от Google, AlphaProof и AlphaGeometry 2, совместно выиграли серебро, решив 4 задачи.

Любопытно, что модель Google DeepMind тоже решила задачи на золото в этом году. Причем узнали Google об этом в пятницу днем (новость от OpenAI же вышла только в субботу примерно в час ночи).

Но пришлось ждать одобрения маркетинга. Поэтому OpenAI объявили о своем достижении раньше

upd. На 22 июня появилась инфо, что Google ждал официальной оценки результатов от организаторов IMO и объявил о результате только после того, как олимпиада завершилась и участники-школьники получили свои награды. Это было сделано из уважения к подросткам и правилам олимпиады.

OpenAI объявила о успехе раньше, вскоре после итогов конкурса, что вызвало критику со стороны Google. Главная претензия — результат OpenAI не был официально подтвержден оценщиками IMO.
OpenAI в ответ на это заявляет о том, что привлекли сторонних экспертов для проверки (их работу оценивали три бывших призёра IMO, знакомых с системой оценивания).
IMO официальных комментариев не дала.

Наташа Хазеева

11 июня

Apple: современные LLM не способны рассуждать

Серьезный вердикт от Apple, который еще громче звучит с учетом того, что у Apple нет своих LLM. Расскажу, на основе чего Apple пришли к такому выводу (может, они тоже хайпуют?), что об этом думают в сообществе, и что с этим делать (если это так).

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fml-site.cdn-apple.com%2Fpapers%2Fthe-illusion-of-thinking.pdf&postId=2037939" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

#openai #искусственныйинтеллект #matholympiad #imo2025 #золотаямедаль #llm #нейросети #математика #ai #прорыв #новостиai #olympiad #aiвматематике #imo

Модель OpenAI впервые достигла результата уровня золотой медали на Международной математической олимпиаде

Что произошло?

Почему это важно?

Что это за модель?

Как отреагировали на достижение?

А что другие модели?

Пожалуйста, поддержите меня, поставьте лайк