Современные ИИ‑модели успешно сдали сложнейший финансовый экзамен CFA

Исследование, проведённое специалистами NYU Stern и платформой GoodFin, показало, что современные языковые модели справляются с одним из самых сложных профессиональных экзаменов в финансовой сфере — CFA. При этом речь идёт не только о выборе вариантов ответа, но и о полноценной аналитике: модели уверенно решают задачи третьего уровня, включая развернутые эссе, на которые раньше ИИ систематически «проваливался».

Современные ИИ‑модели успешно сдали сложнейший финансовый экзамен CFA

В рамках эксперимента протестировали 23 модели, в том числе от OpenAI, Google и Anthropic. Девять из них получили проходной балл выше 63% — такой результат позволяет сдать третий уровень экзамена. Особенно успешно выступила новая модель OpenAI o4‑mini, набравшая 79,1% на письменной части. Модель Gemini 2.5 Pro показала результат 75,9%, Claude 4 Opus74,9%. Все три модели преодолели порог, включая задания, требующие не только запоминания информации, но и логики, интерпретации и письменного обоснования решений.

Обычно подготовка к полному курсу CFA занимает у человека до тысячи часов на протяжении нескольких лет. Модели справились с заданиями за минуты. При этом, по результатам тестирования, письменные ответы ИИ получали от экспертов более высокие оценки, чем при автоматической проверке: разница составила в среднем 5,6 балла в пользу ручной оценки, что говорит о том, что эссе действительно выглядели убедительно — не только по форме, но и по содержанию.

Два года назад языковые модели не могли пройти письменные части CFA-экзаменов, даже если показывали хороший результат в тестах. Сейчас они не только стабильно преодолевают порог, но и набирают баллы, сопоставимые с результатами подготовленных специалистов. Это один из наглядных примеров того, как быстро прогрессируют языковые модели — особенно в части аргументации, анализа и структуры сложных ответов.

Исследователи подчёркивают, что модели становятся всё более пригодными для задач, связанных с аналитикой, интерпретацией информации и принятием решений. При этом в финансовой сфере вырастает значение тех аспектов, где машины пока уступают: способность учитывать контекст, работать с клиентами, распознавать нюансы коммуникации и формировать суждения в неоднозначных ситуациях.

1
2 комментария