🚨 OpenAI случайно раскрыла «Ultrafast mode» для Codex!

🚨 OpenAI случайно раскрыла «Ultrafast mode» для Codex!

В репозитории GitHub Codex (в файле models.json) на короткое время появился новый режим под названием Ultrafast.

Описание гласит:

«The fastest available responses for latency-sensitive work.»(«Самые быстрые доступные ответы для задач, чувствительных к задержкам.»)

🚨 OpenAI случайно раскрыла «Ultrafast mode» для Codex!

Рядом с уже существующим режимом Fast (1.5x speed, increased usage) внезапно появился ultrafast. Скриншоты быстро разлетелись по сети, после чего упоминание удалили. Классический «oops» от OpenAI.

Что это значит?

Codex — это код-ориентированная модель OpenAI (преемник старого Codex, который лежит в основе GitHub Copilot и новых инструментов). Разработчики уже жалуются, что даже «быстрый» режим иногда заставляет ждать. В agentic-воркфлоу, где один вызов инструмента блокирует следующий, каждая лишняя секунда превращается в минуты.

Я провел 40+ консультаций по ИИ в бизнесе. Вот что я слышу почти всегда:

«Пробовал ChatGPT — не прижилось»

«Подписался на сервис — непонятно что с ним делать»

«Сотрудники не используют, хотя внедрили»

Проблема не в инструментах. Проблема в том, что ИИ используют как поисковик, а не как сотрудника.

14 мая провожу бесплатный вебинар — покажу как я настроил Claude + Obsidian так, что система сама ведёт клиентов, готовит тексты и держит дедлайны.

🚨 OpenAI случайно раскрыла «Ultrafast mode» для Codex!

Разберём:

— Что такое Claude Code простыми словами

— Как Obsidian становится памятью вашего ИИ-сотрудника

— 4 роли которые можно закрыть уже на следующей неделе: маркетинг, продажи, проекты, аналитика CRM

16:00 МСК · Zoom · Бесплатно

Ссылка для регистрации:

Ultrafast mode, судя по всему, будет использовать:

  • Спекулятивное декодирование
  • Более агрессивное кэширование
  • Возможно, уменьшенный размер модели или оптимизированные inference-параметры

Цель — минимальная задержка для реального времени: автодополнение кода, live-агенты, чат в IDE, робототехника и т.д.

Плюсы и минусы

Плюсы:

  • Разработчики смогут «вибкодить» ещё быстрее
  • Agentic-системы станут ощутимо отзывчивее
  • Конкурентное преимущество против Claude, Gemini и локальных моделей

Минусы (ожидаемые):

  • Скорее всего, ещё выше расход токенов
  • Возможное снижение качества (trade-off speed vs intelligence)
  • Риск «галлюцинаций» в сложных задачах

Один из комментаторов точно подметил: «Бутылочное горлышко в AI-кодинге было не в скорости, а в том, чтобы с первого раза получить правильный ответ».

Что дальше?

Скорее всего, в ближайшие недели OpenAI официально представит Ultrafast как новую опцию (возможно, с доплатой). Это часть большой гонки за снижением latency: после o1, o3, GPT-4.5/5 теперь бьются именно за скорость отклика.

OpenAI снова напоминает, что они — стартап в душе: кто-то случайно запушил изменения в публичный репозиторий, и весь интернет сразу узнал новость раньше времени

Следим за обновлениями. Если Ultrafast действительно окажется революционным — это сильно изменит ежедневный опыт миллионов пользователей

3
Начать дискуссию