GPT-5.5 стал лучшим ИИ в тесте IQ

OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это примерно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.

Канал с гайдами и контентом по claude code, выкладываем новости (когда режут лимиты в 10 раз) и какие инструменты через claude реализуем для проектов, канал: https://t.me/claudedevolper

TrackingAI ведет два теста: публичный Mensa Norway и закрытый Offline Test. Публичный тест доступен в интернете, поэтому его вопросы, ответы или разборы могли попасть в обучающие данные моделей. Offline Test, по словам авторов проекта, составил участник Mensa; эти вопросы не публиковались в сети и не должны были попасть в обучение ИИ. Поэтому закрытый тест интереснее как проверка способности решать новые задачи, а не узнавать уже виденные закономерности.

Еще одна важная деталь: TrackingAI отдельно прогоняет модели в текстовом режиме с включенным компьютерным зрением. Первым IQ-задачи описывают словами, а вторым показывают изображение задания. Поэтому результаты нельзя смешивать в одну общую таблицу: текстовая модель зависит от качества описания, а модель с компьютерным зрением тестируется еще и на способность самостоятельно прочитать визуальную задачу.

Именно из-за этих разделений GPT-5.5 нельзя просто объявить "самым умным ИИ". На закрытом Offline Test текстовые GPT-5.5 Pro и GPT-5.5 Thinking лидируют, но на публичном Mensa Norway среди текстовых моделей GPT-5.5 Thinking не первый: выше в таблице стоят Grok-4.20 Expert Mode, Gemini 3.1 Pro Preview и Claude-4.7 Opus Extended Thinking. Кроме того, этот формат проверяет прежде всего абстрактную логику, а не программирование, научную работу, надежность или работу в роли агента.

Аккуратный вывод такой: GPT-5.5 стал лидером важной части IQ-рейтинга TrackingAI, особенно на закрытом наборе задач. Это сильный результат для задач на абстрактное мышление, но не универсальное доказательство превосходства над всеми ИИ во всех возможных тестах.