OpenAI анонсировала следующее семейство «рассуждающих» моделей — o3

Превью языковой модели o1 компания представила в сентябре 2024 года.

  • OpenAI анонсировала модели o3 и o3-mini. Предыдущая модель называется o1 — компания специально пропустила одну цифру «из уважения к Telefonica (телеком-компания работает под брендом O2 — vc.ru) и традиции придумывать плохие названия», сказал гендиректор OpenAI Сэм Альтман.
  • Разработчики обучали o3 «думать» прежде, чем ответить на запрос пользователя. Поэтому модель отвечает с задержкой, но пересказывает свою цепочку рассуждений, а после даёт ответ, который считает наиболее точным, пишет TechCrunch.
  • Пользователи смогут «настроить» время на рассуждение — чем больше времени дать модели, тем лучше она справится с запросом.
  • В тесте ARC-AGI, разработанном для оценки способности ИИ осваивать навыки, выходя за пределы обучающих данных, результат o3 достигал 87,5%. Результат в 85% считается «человеческим уровнем». Однако TechCrunch отмечает, что к этим данным стоит относиться скептически и подождать «внешние» тесты.
Сравнение работы превью o1, o1 и o3. Слева — соревнование по математике, справа — опросник с научными вопросами уровня аспирантуры. Вертикальная шкала — точность ответов. Источник: OpenAI
Сравнение работы превью o1, o1 и o3. Слева — соревнование по математике, справа — опросник с научными вопросами уровня аспирантуры. Вертикальная шкала — точность ответов. Источник: OpenAI
  • Обе модели пока недоступны широкому кругу пользователей, но будут доступны для public safety tests — их смогут протестировать исследователи безопасности. По словам Альтмана, OpenAI планирует выпустить o3-mini к концу января 2025 года, а после этого и o3.
  • OpenAI представила превью языковой модели o1, которая заточена под требующие рассуждений задачи, в сентябре 2024 года. В начале декабря компания выпустила полную версию модели и добавила подписку ChatGPT Pro с доступом к «эксклюзивной» версии.
1414
77
108 комментариев
300 ₽

Ну раз тут все рекламируются, o1 можно пользоваться у нас в сервисе через тг, разумеется, Платно🙌

https://kolersky.com/strawberry_bot

100 ₽

Тем временем где-то в офисе OpenAI.
– ChatGPT, подскажи, как можно объяснить пользователям задержки и подвисания?
– Ну, напишите, что я рассуждаю.

20
4
100 ₽

Ну, а пока мы довольствуемся безлимитным ChatGPT: https://4gpt.ru/unlim/