OpenAI представила превью языковой модели o1 — она заточена под задачи, требующие рассуждений

В частности в точных и естественных науках.

  • Компания рассказала, что ИИ-модели из её новой серии тратят больше времени на обдумывание ответа, прежде чем выдавать его пользователю. Их учат «оттачивать мыслительный процесс, пробовать разные стратегии и распознавать свои ошибки».
  • В тестах по физике, химии и биологии модели отвечали на уровне аспирантов. В отборочном туре Международной математической олимпиады (IMO) GPT-4o правильно решила 13% заданий, а новая «рассуждающая» модель — 83%.
Блоки слева направо: соревнование по математике, соревновние по кодингу и опросник с научными вопросами уровня аспирантуры. Вертикальная шкала — точность ответов. Источник: OpenAI
Блоки слева направо: соревнование по математике, соревновние по кодингу и опросник с научными вопросами уровня аспирантуры. Вертикальная шкала — точность ответов. Источник: OpenAI
  • OpenAI предупредила, что с базовыми запросами эффективнее справляется GPT-4o — у той более «обширные знания о мире».
  • К новым же моделям лучше обращаться при наличии сложных задач. Например, исследователи в медицине могут аннотировать с помощью o1 данные секвенирования, а физики — выводить формулы в квантовой оптике. Разработчикам модель поможет написать и отладить сложный код.
  • В частности для последних компания выпустила облегчённую и менее дорогую версию o1 — o1-mini. Контекстное окно у обеих — 128 тысяч токенов. Файлы и изображения они не принимают, как и не ищут данные в интернете, но это пока.
Диалоговое окно с моделью. Источник: OpenAI
Диалоговое окно с моделью. Источник: OpenAI
  • Пользователи платных тарифов ChatGPT Plus и ChatGPT Team должны получить доступ к превью o1 и o1-mini уже 12 сентября 2024 года. Еженедельный лимит — 30 сообщений для o1-preview и 50 сообщений для o1-mini.
  • Пользователи планов Enterprise и Edu получат доступ на неделе с 16 сентября. А через API их могут протестировать разработчики пятого «тира» (потратили на использование больше $1000), для них ограничение — до 20 запросов в минуту.
  • В будущем лимиты во всех случаях рассчитывают увеличить. В планах также открыть доступ к o1-mini всем пользователям бесплатного плана ChatGPT, но когда — неизвестно.

При работе с o1-preview 1 млн «входных» токенов будет стоить $15, а «выходных» — $60. Для o1-mini это $3 и $12 соответственно.

«Пример решения довольно нетривиальной задачки, с которой текущие модели не справляются», — <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.me%2Fepsiloncorrect%2F200&postId=1469581" rel="nofollow noreferrer noopener" target="_blank">пишет</a> автор канала Epsilon Correct
«Пример решения довольно нетривиальной задачки, с которой текущие модели не справляются», — пишет автор канала Epsilon Correct
3838
88
11
204 комментария

Новости инноваций из России:
- Яндекс выпустил колонку с глазками
- 2Гис добавил на карту построение маршрута
- ТБанк выпустил пластиковую карточку с котом

28
6
1
1
Ответить

Очень странно что даже тут вы приплели «Россию», когда в мире есть ещё 193 страны помимо США, которые также не имеют и близко аналога ChatGPT

37
1
Ответить

А ты смешной
- Алиса объективно лучше Сири и Алексы
- 2Гис не хуже гугл карт
- Банковские приложения в целом все лучше чем в США и Европе

31
4
Ответить

Чел, России не хватает только чипов. Ну и нормального прези… ой.

6
2
Ответить

Да. Жаль родители Ильи Суцкевера в России не остались. Был бы ЖПТ, а не GPT

1
Ответить

Яндекс на месте тоже не сидит

Ответить

Новость про то, что Яндекс представил нейросеть для программирования вы намеренно пропустили.

1
Ответить