OpenAI выпустили новую модель o1 (ту самую Strawberry)

OpenAI снова наделали шума в мире искусственного интеллекта, запустив preview-версию своей новой модели o1, также известной как Strawberry (и Q* для тех, кто в теме). Эта модель — следующий шаг после GPT-4o и обещает значительно улучшить способность машин к рассуждениям.

Что это значит для нас, простых пользователей? Вот краткий гид:

  • Крутые результаты: o1 превзошла GPT-4o почти по всем тестам. Модель решает задачи по математике на олимпиадном уровне (74% против 12% у GPT-4o), справляется с программированием лучше большинства и даже обходит PhD-экспертов по физике, биологии и химии. По факту, она настолько крута, что ее даже считают одной из лучших на CodeForces и AIME (олимпиада по математике в США).
  • Зачем она думает? В отличие от предыдущих моделей, o1 использует так называемую цепочку рассуждений (Chain of Thought, CoT). Модель «размышляет» перед тем, как ответить. Это не просто вывод на основе данных — она действительно анализирует задачу и ищет решение, что делает её мощнее, но и требует больше ресурсов.
  • Сложности запуска: Пока эта модель доступна только для подписчиков ChatGPT Plus в виде preview-версии (и чуть упрощенной версии o1-mini для тех, кто экономит). При этом даже у подписчиков есть ограничения — 30 сообщений в неделю для o1-preview и 50 для o1-mini. Но самое «веселое» — это API: 20 запросов в минуту, и платить надо даже за «размышления» модели.
  • Особенности промптинга: Если вы привыкли указывать модели шаги (например, «думай по шагам» или «строь план решения»), забудьте! Для o1 это больше не нужно. OpenAI выпустила гайд о том, как правильно формулировать запросы для новой модели — ясно и прямо, остальное она сделает сама.
  • Скрытый процесс мышления: Не всё, что думает модель, показывают пользователям. Большая часть размышлений скрыта от нас, и мы видим только результат, который OpenAI считает подходящим. Жаль, что мы не можем читать мысли людей с такой же лёгкостью, как у этой модели.

Модель еще не в полной боевой готовности, но она уже показывает серьёзный потенциал. Осталось дождаться полной раскатки и привыкнуть к новым правилам игры!
Всех, кто интересуется последними новинками из мира AI призываем подписываться на наш канал. А тех, кто уже сейчас хочет попробовать себя в роли нейрокреатора, приглашаем на наш сайт.

Начать дискуссию