Исследователь ИИ Мария Сухарева утверждает в своём Substack, что результаты бенчмарков GPT-5.2 от OpenAI—включая 100% на AIME 2025 и 52,9% на ARC-AGI-2—бессмысленны без прозрачности относительно обучающих данных и архитектуры модели, называя их «неподтверждёнными цифрами» в эпоху, когда «компании получают миллиарды» за такие заявления.