Как описывается на портале TechCrunch, OpenAI обучала o3 «думать, прежде чем отвечать», с помощью технологии «частной цепочки мыслей». Модель может рассуждать о поставленной задаче и заранее распланировать ответ, выполняя ряд последовательных действий, помогающих ей найти решение. На практике, как пишет портал, после ввода запроса o3 делает паузу, рассматривая ряд связанных подсказок и «объясняя» свои рассуждения по ходу дела, а затем выделяет и группирует ту информацию, которую считает наиболее точной в конкретном случае, и выдаёт её в качестве ответа.
Я так же читала о том, что здесь используется по сути подобие человеческого мышления. Как вы сказали - перепроверки его тормозят и есть возможность выбирать как долго он будет обрабатывать ответ, но чем меньше времени ему дать на "обдумывание", то с большей вероятностью он даст неверный ответ