GPT-5.4 вышла с управлением компьютером: тестируем первую модель OpenAI с computer use

GPT-5.4 вышла с управлением компьютером: тестируем первую модель OpenAI с computer use

Приветствую! OpenAI выпустила GPT-5.4 - новую флагманскую модель, которая заменяет GPT-5.2 и GPT-5.3-Codex. Главная фишка - встроенное управление компьютером через интерфейс.

Модель умеет читать скриншоты, нажимать кнопки, заполнять формы и проверять результат. Раньше computer use был только в экспериментальных версиях, теперь это основная функция.

Что нового в GPT-5.4

Контекстное окно выросло до 1,05 млн токенов - в 2,5 раза больше, чем у GPT-5.2. При этом модель тратит меньше токенов на те же задачи, что частично компенсирует рост цены в API.

Computer use из коробки - GPT-5.4 стала первой основной моделью OpenAI с этой функцией. Может взаимодействовать с программами через интерфейс, автоматизировать рутину в браузере и приложениях.

Tool search - подгружает определения инструментов по запросу, а не передает все сразу. Это снижает расход токенов и улучшает точность выбора в сложных агентных сценариях.

Режим экстремального мышления (xhigh) - модель тратит больше вычислительных ресурсов на особо сложные задачи. Для максимальной точности в критичных ситуациях.

Нативная компакция контекста - сжимает длинные агентные сессии без потери ключевой информации. Полезно для многошаговых задач.

План работы перед выполнением - в ChatGPT модель показывает план перед выполнением сложного запроса. Можно скорректировать направление в процессе.

Результаты на бенчмарках

GPT-5.4 серьезно прибавила в агентных задачах по сравнению с GPT-5.2:

  • OSWorld-Verified: 75% против 47,3%
  • BrowseComp: 82,7% против 65,8%
  • GDPval: 83% против 70,9%
  • SWE-Bench Pro: 57,7% против 55,6%

OpenAI называет GPT-5.4 самой точной моделью: ложные утверждения встречаются на 33% реже, ошибки снизились на 18%.

Цены и доступность

Базовая GPT-5.4: $2,50 за миллион входных токенов, $15 за миллион выходных. Для сложных задач есть GPT-5.4-pro за $30/$180.

Модель стала дефолтной в API и Codex. В ChatGPT раскатывается сейчас, пользователи Pro сразу получат Pro-версию.

Больше практических гайдов по нейросетям публикую в своем Телеграм-канале. Если интересна тема AI без воды и с конкретными примерами - добро пожаловать!

Начать дискуссию