GPT-5 от OpenAI уже здесь.
Компания OpenAI представила GPT-5 — новую флагманскую модель искусственного интеллекта, которая ляжет в основу следующего поколения ChatGPT.
ИИ, Telegram, автоматизация и цифровая инфраструктура — от новых фич до конфликтов интересов. Обновления, разборы, системы, из которых складываются деньги.
Оглавление:
Агентная модель.
GPT-5, выпущенный в четверг, — это первая «унифицированная» модель искусственного интеллекта от OpenAI, которая сочетает в себе аналитические способности моделей o-серии с быстрыми ответами моделей серии GPT. Модель нового поколения знаменует собой начало новой эры для ChatGPT и его создателя OpenAI, указывая на более масштабные амбиции OpenAI по разработке систем искусственного интеллекта, которые больше похожи на агентов, чем на чат-ботов.
Если GPT-4 позволял чат-ботам с искусственным интеллектом давать разумные ответы на самые разные вопросы, то GPT-5 позволяет ChatGPT выполнять широкий спектр задач от имени пользователей, например генерировать программные приложения, управлять календарем пользователя или создавать исследовательские задания.С помощью GPT-5 компания OpenAI также стремилась упростить использование ChatGPT. Вместо того чтобы предлагать пользователям выбрать правильные настройки, GPT-5 оснащён маршрутизатором, который в режиме реального времени решает, как дать лучший ответ: быстро ответить на вопрос пользователя или потратить дополнительное время на «обдумывание» ответа.
Во время брифинга с журналистами генеральный директор OpenAI Сэм Альтман заявил, что GPT-5 — «лучшая модель в мире», и сказал, что это «значительный шаг» на пути компании к разработке искусственного интеллекта, который сможет превзойти человека в выполнении наиболее экономически ценных задач, то есть общего искусственного интеллекта (AGI).
«В любое другое время в истории было бы практически невозможно представить себе что-то подобное GPT-5», — сказал Альтман.
Начиная с четверга GPT-5 стал доступен всем бесплатным пользователям ChatGPT в качестве модели по умолчанию. Вице-президент OpenAI по ChatGPT Ник Терли заявил, что это часть усилий компании, направленных на то, чтобы впервые предоставить бесплатным пользователям доступ к модели ИИ для логического вывода. (Ранее компания закрывала доступ к этим более продвинутым моделям за платной подпиской.)
«Это лишь один из способов, с помощью которых я с энтузиазмом выполняю свою миссию, следя за тем, чтобы эти разработки действительно приносили пользу людям», — сказал Терли о принятом решении, ссылаясь на давнюю миссию OpenAI по распространению передовых технологий искусственного интеллекта среди как можно большего числа людей.
Ожидания от GPT-5, одного из самых ожидаемых продуктов OpenAI с тех пор, как ChatGPT прославил компанию в 2022 году, высоки. С тех пор ChatGPT стал одним из самых популярных потребительских продуктов в мире: по данным компании, каждую неделю им пользуются более 700 миллионов человек — почти 10 % населения планеты.
Многие считают GPT-5 индикатором прогресса в области ИИ в целом, и реакция Кремниевой долины на эту модель может иметь серьёзные последствия для крупных технологических компаний, Уолл-стрит и политиков, регулирующих сферу технологий. Эти заинтересованные стороны следят за тем, сможет ли GPT-5 значительно расширить возможности ИИ, как это сделал его предшественник GPT-4, который превзошёл ожидания в отношении возможностей программного обеспечения.
Результаты на бенчмарках.
OpenAI утверждает, что GPT-5 является самой современной моделью в нескольких областях и немного превосходит ведущие модели ИИ от Anthropic, Google DeepMind и xAI Илона Маска по ключевым показателям. Однако в других областях GPT-5 немного уступает передовым моделям ИИ.
Компания утверждает, что GPT-5 обеспечивает высочайшую производительность при написании кода. По словам Альтмана, эта модель особенно хорошо справляется с созданием целых программных приложений по запросу, что получило название «вибрационное кодирование».
На SWE-bench Verified — тесте реальных задач по программированию, взятых с GitHub, — GPT-5 с первой попытки набрал 74,9 %. Это означает, что GPT-5 лишь немного превосходит последнюю модель Claude Opus 4.1 от Anthropic, которая набрала 74,5 %, и Gemini 2.5 Pro от Google DeepMind, которая набрала 59,6 %.
На «Последнем экзамене человечества» — сложном тесте, оценивающем эффективность моделей ИИ в математике, гуманитарных и естественных науках, — версия GPT-5 с расширенным анализом (GPT-5 Pro) набрала 42 % при использовании инструментов. Это немного меньше, чем удалось достичь xAI с помощью Grok 4 Heavy, который набрал 44,4 % на тесте.
На экзамене GPQA Diamond, состоящем из научных вопросов для докторантов, GPT-5 pro с первой попытки набрал 89,4 %, опередив Claude Opus 4.1, набравшего 80,9 %, и Grok 4 Heavy, набравшего 88,9 %.
Новый опыт ChatGPT.
OpenAI утверждает, что GPT-5 лучше справляется с ответами на вопросы, связанные со здоровьем. По данным HealthBench Hard Hallucinations, теста, измеряющего точность ответов моделей ИИ на темы, связанные со здравоохранением, GPT-5 (с функцией «размышления») допускает галлюцинации всего в 1,6 % случаев. Это намного ниже, чем у предыдущих моделей компании GPT-4o и o3, которые набрали 12,9 % и 15,8 % соответственно.
Хотя чат-боты с искусственным интеллектом не являются медицинскими работниками, миллионы людей используют их для получения рекомендаций по вопросам здоровья. В ответ на это компания заявляет, что GPT-5 более активно выявляет потенциальные проблемы со здоровьем и помогает пользователям анализировать медицинские результаты.
Кроме того, OpenAI утверждает, что GPT-5 лучше других моделей ИИ справляется с более сложными для измерения субъективными областями, такими как креативный дизайн и писательство. Тёрли сказал, что GPT-5 отвечает более естественно и демонстрирует «более тонкий вкус», чем другие модели ИИ, при выполнении творческих задач.
«У этой модели действительно хорошая атмосфера», — сказал Терли.
GPT-5 также более точен, чем предыдущие модели OpenAI, и, по словам компании, гораздо меньше подвержен «галлюцинациям» — склонности моделей ИИ выдумывать информацию — по сравнению с моделями серии o. «Галлюцинации», похоже, усиливались в последних моделях ИИ OpenAI, таких как o3, и ранее OpenAI заявляла, что не совсем понимает, почему это происходит.
В ответах на запросы ChatGPT компания OpenAI обнаружила, что GPT-5 (с функцией «размышления») в 4,8 % случаев выдаёт ложную информацию. Это значительное снижение по сравнению с o3 и GPT-4o, у которых показатель ложных ответов составил 22 % и 20,6 % соответственно.
На эталонном тесте Tau-bench, измеряющем способность ИИ-модели выполнять смоделированные онлайн-задачи, GPT-5 показал неоднозначные результаты. В части теста, измеряющей способность ИИ ориентироваться на сайте авиакомпании, GPT-5 набрал 63,5 %, немного уступив o3, который набрал 64,8 %. В другой части теста, оценивающей способность ИИ ориентироваться на сайтах розничной торговли, GPT-5 набрал 81,1 %, уступив Claude Opus 4.1, который набрал 82,4 %.
OpenAI также заявляет, что GPT-5 безопаснее предыдущих моделей. Хотя модели ИИ, основанные на рассуждениях, иногда демонстрируют склонность к заговорам против людей или лжи ради достижения собственных целей, OpenAI обнаружила, что GPT-5 обманывает реже, чем другие модели.
Алекс Бьютел, руководитель отдела исследований безопасности OpenAI, сказал, что снижение уровня обмана повышает не только безопасность GPT-5, но и удобство использования, создавая модель, которая более «прозрачна и честна в том, что касается доверия пользователей».
Бейтел также отмечает, что GPT-5 лучше распознаёт злоумышленников, которые пытаются использовать ChatGPT не по назначению, и пользователей, отправляющих безобидные запросы. Благодаря этому GPT-5 может отклонять больше небезопасных запросов, при этом реже отказывая пользователям, которые ищут безобидную информацию.
Обновления для пользователей и разработчиков
В рамках запуска GPT-5 в ChatGPT будет улучшен пользовательский интерфейс. Теперь пользователи могут выбрать один из четырёх новых стилей общения в настройках ChatGPT: «Циник», «Робот», «Слушатель» и «Ботаник». Компания заявляет, что это позволит адаптировать ответы ChatGPT без необходимости специально просить модель отвечать определённым образом.
Подписчики тарифного плана ChatGPT Plus за 20 долларов в месяц получают более высокие лимиты использования GPT-5, чем бесплатные пользователи. Между тем подписчики тарифного плана Pro за 200 долларов в месяц получат неограниченный доступ к GPT-5, а также к улучшенной версии под названием GPT-5 Pro, которая использует дополнительные вычислительные ресурсы для получения более качественных ответов. На следующей неделе организации, использующие тарифные планы OpenAI Team, Edu и Enterprise, получат доступ к GPT-5 в качестве модели по умолчанию.
Для разработчиков GPT-5 будет доступен в API OpenAI в трёх вариантах: gpt-5, gpt-5-mini и gpt-5-nano, которые будут тратить больше или меньше времени на «обдумывание» задач. Разработчики также могут контролировать многословность в API OpenAI, решая, насколько длинными или короткими должны быть ответы модели ИИ.
Базовая модель GPT-5 будет стоить разработчикам 1,25 доллара за миллион входных токенов (примерно 750 000 слов, что больше, чем во всей серии «Властелин колец») и 10 долларов за миллион выходных токенов.
Запуск GPT-5 состоялся после напряжённой недели для OpenAI. Компания выпустила модель рассуждений с открытым исходным кодом gpt-oss, которую разработчики и предприятия могут скачать бесплатно и использовать за небольшую плату. Открытая модель почти не уступает предыдущим топовым моделям OpenAI, o3 и o4-mini, но GPT-5 устанавливает новый стандарт производительности в некоторых областях, например в программировании.
Тем не менее, GPT-5, похоже, примерно на одном уровне с другими передовыми моделями ИИ в нескольких областях. Конечно, тесты дают лишь частичное представление о любой модели ИИ, и ещё предстоит выяснить, как разработчики будут использовать GPT-5 в реальном мире и действительно ли эта модель на шаг впереди конкурентов.