GPT-5.2 от OpenAI шокирует учёных: набрал 77% на FrontierScience и готов к лабораториям

OpenAI опубликовал результаты тестов GPT-5.2 на бенчмарках FrontierScience

GPT-5.2 от OpenAI шокирует учёных: набрал 77% на FrontierScience и готов к лабораториям

77% на олимпиадных задачах (Olympiad) и 25% на исследовательских (Research), обходя Gemini 3 Pro (76% и 20%) и Claude Opus 4.5 (71% и 18%). На GDPval модель достигла 71% успеха (win/tie rate) в задачах экономической ценности против экспертов, опередив GPT-5 (38.8%), а на GPQA Diamond Pro-версия набрала 93.2%.

Готовы доверить ИИ PhD-уровень исследований?

______________

3
4 комментария