OpenAI анонсировала следующее семейство «рассуждающих» моделей — o3

Превью языковой модели o1 компания представила в сентябре 2024 года.

OpenAI анонсировала модели o3 и o3-mini. Предыдущая модель называется o1 — компания специально пропустила одну цифру «из уважения к Telefonica (телеком-компания работает под брендом O2 — vc.ru) и традиции придумывать плохие названия», сказал гендиректор OpenAI Сэм Альтман.
Разработчики обучали o3 «думать» прежде, чем ответить на запрос пользователя. Поэтому модель отвечает с задержкой, но пересказывает свою цепочку рассуждений, а после даёт ответ, который считает наиболее точным, пишет TechCrunch.
Пользователи смогут «настроить» время на рассуждение — чем больше времени дать модели, тем лучше она справится с запросом.
В тесте ARC-AGI, разработанном для оценки способности ИИ осваивать навыки, выходя за пределы обучающих данных, результат o3 достигал 87,5%. Результат в 85% считается «человеческим уровнем». Однако TechCrunch отмечает, что к этим данным стоит относиться скептически и подождать «внешние» тесты.

Сравнение работы превью o1, o1 и o3. Слева — соревнование по математике, справа — опросник с научными вопросами уровня аспирантуры. Вертикальная шкала — точность ответов. Источник: OpenAI

Обе модели пока недоступны широкому кругу пользователей, но будут доступны для public safety tests — их смогут протестировать исследователи безопасности. По словам Альтмана, OpenAI планирует выпустить o3-mini к концу января 2025 года, а после этого и o3.
OpenAI представила превью языковой модели o1, которая заточена под требующие рассуждений задачи, в сентябре 2024 года. В начале декабря компания выпустила полную версию модели и добавила подписку ChatGPT Pro с доступом к «эксклюзивной» версии.

Ася Карпова

ChatGPT

06.12.2024

Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей

Модель должна рисовать, работать с текстом и программировать «лучше», чем её предшественница GPT-4o. В заметке — несколько примеров.

Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей

#новости #openai