🚨 OpenAI случайно раскрыла «Ultrafast mode» для Codex!
В репозитории GitHub Codex (в файле models.json) на короткое время появился новый режим под названием Ultrafast.
Описание гласит:
«The fastest available responses for latency-sensitive work.»(«Самые быстрые доступные ответы для задач, чувствительных к задержкам.»)
Рядом с уже существующим режимом Fast (1.5x speed, increased usage) внезапно появился ultrafast. Скриншоты быстро разлетелись по сети, после чего упоминание удалили. Классический «oops» от OpenAI.
Что это значит?
Codex — это код-ориентированная модель OpenAI (преемник старого Codex, который лежит в основе GitHub Copilot и новых инструментов). Разработчики уже жалуются, что даже «быстрый» режим иногда заставляет ждать. В agentic-воркфлоу, где один вызов инструмента блокирует следующий, каждая лишняя секунда превращается в минуты.
Я провел 40+ консультаций по ИИ в бизнесе. Вот что я слышу почти всегда:
«Пробовал ChatGPT — не прижилось»
«Подписался на сервис — непонятно что с ним делать»
«Сотрудники не используют, хотя внедрили»
Проблема не в инструментах. Проблема в том, что ИИ используют как поисковик, а не как сотрудника.
14 мая провожу бесплатный вебинар — покажу как я настроил Claude + Obsidian так, что система сама ведёт клиентов, готовит тексты и держит дедлайны.
Разберём:
— Что такое Claude Code простыми словами
— Как Obsidian становится памятью вашего ИИ-сотрудника
— 4 роли которые можно закрыть уже на следующей неделе: маркетинг, продажи, проекты, аналитика CRM
16:00 МСК · Zoom · Бесплатно
Ссылка для регистрации:
Ultrafast mode, судя по всему, будет использовать:
- Спекулятивное декодирование
- Более агрессивное кэширование
- Возможно, уменьшенный размер модели или оптимизированные inference-параметры
Цель — минимальная задержка для реального времени: автодополнение кода, live-агенты, чат в IDE, робототехника и т.д.
Плюсы и минусы
Плюсы:
- Разработчики смогут «вибкодить» ещё быстрее
- Agentic-системы станут ощутимо отзывчивее
- Конкурентное преимущество против Claude, Gemini и локальных моделей
Минусы (ожидаемые):
- Скорее всего, ещё выше расход токенов
- Возможное снижение качества (trade-off speed vs intelligence)
- Риск «галлюцинаций» в сложных задачах
Один из комментаторов точно подметил: «Бутылочное горлышко в AI-кодинге было не в скорости, а в том, чтобы с первого раза получить правильный ответ».
Что дальше?
Скорее всего, в ближайшие недели OpenAI официально представит Ultrafast как новую опцию (возможно, с доплатой). Это часть большой гонки за снижением latency: после o1, o3, GPT-4.5/5 теперь бьются именно за скорость отклика.
OpenAI снова напоминает, что они — стартап в душе: кто-то случайно запушил изменения в публичный репозиторий, и весь интернет сразу узнал новость раньше времени
Следим за обновлениями. Если Ultrafast действительно окажется революционным — это сильно изменит ежедневный опыт миллионов пользователей