OpenAI выпустила GPT-5.2: новая нейросеть с человеческим мышлением

Вчера OpenAI выпустили GPT-5.2, и вот что тут интересно.

Может показаться, что это очередная модель на пару процентов лучше предыдущей, но GPT-5.2 стала самой человеческой нейросетью на данный момент.

Есть бенчмарк ARC-AGI-2 на абстрактное мышление. Он проверяет не знания, а способность самостоятельно придумывать правила и комбинировать их для решения новых задач. Его называют тестом на искусственный разум. Средний человек с хорошими умственными способностями набирает 60%, GPT-5.2 показала 53-54%. Впервые разрыв между человеком и AI стал настолько малым.

Второй момент: сложный математический экзамен AIME 2025. Алгебра, геометрия, комбинаторика на уровне олимпиад. GPT-5.2 впервые решила все задачи на 100%. Ни одной ошибки.

Третий: тест GDPval проверяет, может ли AI выполнять реальную работу из разных профессий. Результат 70-74% означает уровень хорошего специалиста. Выше, чем у большинства работников.

Что-то мне подсказывает, что следующий год будет очень интересным для рынка труда.

Подписывайтесь на Telegram Робот сочинит симфонию?.

1
1 комментарий