GPT-5.4 вышла с управлением компьютером: тестируем первую модель OpenAI с computer use
Приветствую! OpenAI выпустила GPT-5.4 - новую флагманскую модель, которая заменяет GPT-5.2 и GPT-5.3-Codex. Главная фишка - встроенное управление компьютером через интерфейс.
Модель умеет читать скриншоты, нажимать кнопки, заполнять формы и проверять результат. Раньше computer use был только в экспериментальных версиях, теперь это основная функция.
Что нового в GPT-5.4
Контекстное окно выросло до 1,05 млн токенов - в 2,5 раза больше, чем у GPT-5.2. При этом модель тратит меньше токенов на те же задачи, что частично компенсирует рост цены в API.
Computer use из коробки - GPT-5.4 стала первой основной моделью OpenAI с этой функцией. Может взаимодействовать с программами через интерфейс, автоматизировать рутину в браузере и приложениях.
Tool search - подгружает определения инструментов по запросу, а не передает все сразу. Это снижает расход токенов и улучшает точность выбора в сложных агентных сценариях.
Режим экстремального мышления (xhigh) - модель тратит больше вычислительных ресурсов на особо сложные задачи. Для максимальной точности в критичных ситуациях.
Нативная компакция контекста - сжимает длинные агентные сессии без потери ключевой информации. Полезно для многошаговых задач.
План работы перед выполнением - в ChatGPT модель показывает план перед выполнением сложного запроса. Можно скорректировать направление в процессе.
Результаты на бенчмарках
GPT-5.4 серьезно прибавила в агентных задачах по сравнению с GPT-5.2:
- OSWorld-Verified: 75% против 47,3%
- BrowseComp: 82,7% против 65,8%
- GDPval: 83% против 70,9%
- SWE-Bench Pro: 57,7% против 55,6%
OpenAI называет GPT-5.4 самой точной моделью: ложные утверждения встречаются на 33% реже, ошибки снизились на 18%.
Цены и доступность
Базовая GPT-5.4: $2,50 за миллион входных токенов, $15 за миллион выходных. Для сложных задач есть GPT-5.4-pro за $30/$180.
Модель стала дефолтной в API и Codex. В ChatGPT раскатывается сейчас, пользователи Pro сразу получат Pro-версию.
Больше практических гайдов по нейросетям публикую в своем Телеграм-канале. Если интересна тема AI без воды и с конкретными примерами - добро пожаловать!