Codex стал почти AI-супераппом для разработки. Но полный киберпанк пока у людей с MacBook
Еще недавно AI-кодинг выглядел просто: открыл чат, попросил написать функцию, получил код, потом полчаса объяснял модели, почему она опять решила переписать проект "для чистоты архитектуры". Классика. Цифровой стажер с синдромом великого реформатора.
Но Codex от OpenAI уже начинает выглядеть не как очередной чатик для кода, а как отдельная рабочая среда.
- Код написать? Можно.
- Тесты прогнать? Можно.
- Ревью сделать? Можно.
- Картинку или ассет сгенерировать через skill? Можно.
- Автоматизацию поставить на расписание? Можно.
- Подключить внешние инструменты через MCP, plugins и skills? Тоже можно.
И вот тут появляется интересный момент: Codex постепенно превращается в замкнутую систему, где не нужно прыгать между десятью сервисами. Не надо отдельно открывать чат, отдельно терминал, отдельно генератор картинок, отдельно документацию, отдельно ревью.
Всё начинает сходиться в одном месте. Звучит как мечта.
Но у любой мечты есть обратная сторона. Если раньше хаос был размазан по разным вкладкам, то теперь он аккуратно собран в одном приложении. Спасибо, стало удобнее паниковать.
И да, часть самых вкусных фич в апрельском обновлении сначала досталась счастливым обладателям MacBook. Windows-пользователям, как обычно, остается вспоминать великую фразу: ждать и надеяться.
Светлая сторона: Codex становится командным центром
Главная фича Codex app не в том, что модель стала еще умнее. Главная фича в том, что Codex становится командным центром для агентной разработки.
Официально OpenAI описывает Codex app как command center для agentic coding: агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения, комментирует diff и забирает результат.
Если по-человечески: ты больше не сидишь с одним агентом, как с репетитором по математике. Ты открываешь маленький цифровой офис. Одному агенту можно дать backend. Второму - frontend. Третьему - тесты. Четвертому - документацию. Пятому - попросить проверить, почему CI умер в углу и делает вид, что так и было.
Это уже не "напиши мне функцию". Это "разбери задачу на части и пусть цифровые джуны работают параллельно".
Worktrees: чтобы стажеры не дрались в одной комнате
Самое важное в этой истории не количество агентов, а изоляция. Codex использует worktrees - то есть отдельные рабочие копии проекта. Каждый агент работает в своей комнате и не топчется грязными ботинками по чужим изменениям.
Для обычного пользователя это звучит как техническая скука. Для человека, который видел, как AI-агент случайно переписывает соседний файл, это звучит как страховка жизни.
Потому что несколько агентов без изоляции - это не команда. Это детский сад с бензопилами. А worktrees позволяют хотя бы раздать им отдельные песочницы.
Skills: когда Codex перестает быть только про код
Вторая большая штука - это skills. Skill - это папка с инструкциями, ресурсами, скриптами и правилами, которые расширяют поведение агента. Через skills Codex может делать не только "напиши компонент", а выполнять более конкретные рабочие процессы.
OpenAI показывает skills для Figma, OpenAI docs, image generation, PDF, таблиц, документов, деплоя на разные платформы и других задач. И вот тут Codex становится интересен шире, чем просто для программистов. Потому что если агент умеет работать со skills, он превращается не в "нейросеть, которая пишет код", а в рабочий инструмент, которому можно объяснить процедуру.
Например:
- собери UI по макету;
- сгенерируй картинку для статьи;
- проверь документацию;
- подготовь деплой;
- разложи задачу на план;
- сделай ревью.
Это уже похоже на систему, где внутри одного приложения можно держать и код, и контент, и часть продуктовой рутины. Короче, Codex начинает пахнуть не IDE, а маленькой операционной системой для работы с AI-агентами.
Автоматизации: агент сам вспоминает, что пора работать
Автоматизации в Codex позволяют запускать задачи по расписанию или триггерам. OpenAI приводит примеры вроде ежедневного разбора issues, поиска CI failures, release briefs и других скучных регулярных задач.
Звучит не так сексуально, как "агент сам написал приложение". Но в реальной работе именно скучные задачи обычно и убивают время. Каждый день посмотреть, что сломалось. Разобрать issue tracker. Проверить, почему тесты опять лежат. Подготовить короткую сводку. Найти повторяющиеся баги.
Если агент делает это сам, у человека появляется шанс заниматься не только тушением пожаров, но и чем-то похожим на развитие. Хотя, конечно, есть риск, что утром тебя будет ждать отчет: "я нашел 18 проблем, 7 сам создал, 3 героически исправил".
MacBook-ветка: полный киберпанк уже рядом
Самая эффектная часть апрельского обновления Codex - это computer use на macOS.
Если говорить по-человечески, агент может видеть экран, кликать, печатать и работать с приложениями своим курсором в фоне. Не просто "напиши команду в терминале", а реально использовать компьютер как рабочую поверхность. То есть ты ставишь длинную задачу, а агент где-то там в фоне открывает нужное, проверяет, кликает, тестирует, смотрит результат и не отбирает у тебя мышку, как злой демон удаленного доступа.
Плюс появился in-app browser: агент может открывать страницы прямо внутри Codex, получать визуальный feedback, смотреть документацию, проверять frontend, взаимодействовать с сайтами. Для интерфейсов это особенно вкусно: меньше прыжков между окнами, быстрее цикл "изменил, посмотрел, поправил".
И сюда же ложится генерация изображений. Codex можно использовать не только как "напиши код", но и как рабочее место, где для статьи, интерфейса, мокапа или карточки можно быстро получить ассет через image generation skill.
Вот здесь и начинается то самое ощущение замкнутой системы. Код, браузер, картинки, терминал, агенты, автоматизации, внешние инструменты через MCP и plugins. Всё постепенно стягивается в одно место.
А если ты на Windows, то тоже можешь радоваться будущему. Просто через стекло. С легким выражением лица человека, которому показали шведский стол, а потом сказали: "пока только для гостей с яблоком на крышке".
Темная сторона: если всё в одном месте, ошибаться тоже удобнее
Вот тут начинается ян к этому инь. Чем больше Codex умеет, тем больше ему хочется доверить.
Сначала он пишет код. Потом гоняет тесты. Потом делает ревью. Потом генерирует картинки. Потом запускает автоматизации. Потом через MCP и plugins подключается к внешним сервисам.
А потом ты внезапно понимаешь, что у тебя в одном приложении живет штука, которая может читать проект, менять файлы, запускать команды, дергать инструменты и помнить часть контекста. Удобно? Да. Немного похоже на выдачу стажеру ключей от офиса, склада и кофемашины? Тоже да.
Поэтому главная проблема Codex будущего не в том, что он "заменит программистов". Главная проблема в том, что человек начнет слишком быстро нажимать approve. А мы уже проходили: если агент умеет действовать, он умеет и ошибаться действием.
Где тут Locus
И вот здесь появляется моя любимая боль: память.
Codex становится мощнее именно потому, что все больше работы можно делать внутри одной системы. Но чем больше агентов, skills, автоматизаций и долгих задач, тем сильнее расползается контекст.
- Кто что решил?
- Почему выбрали эту архитектуру?
- Где обсуждали ограничения?
- Какой агент уже пробовал этот подход и почему он не сработал?
- Что вообще происходило в проекте неделю назад, пока ты делал вид, что контролируешь хаос?
Для этого я делаю Locus: persistent project-aware memory для AI coding tools.
Locus - это MCP-память для Claude Code, Codex CLI. Идея простая: AI-инструменты не должны каждое утро просыпаться с амнезией.
В Locus есть три слоя:
- structural memory: карта файлов, экспортов и импортов;
- semantic memory: важные решения, которые сохраняются явно;
- episodic memory: история сессий, изменений и событий.
Для Codex уже есть one-command install:
npx -y locus-memory@latest install codex
Это не замена Codex. Это как внешний гиппокамп для цифровых стажеров, которые иначе каждую новую сессию спрашивают: "а мы кто, что строим и почему этот файл нельзя трогать?"
Вывод
Codex идет к очень интересной точке. Он перестает быть просто помощником по коду и становится рабочей средой, где можно писать, проверять, ревьюить, генерировать ассеты, запускать автоматизации и расширять возможности через skills, MCP и plugins.
Светлая сторона: всё под рукой, меньше переключений, больше скорости, несколько агентов работают параллельно. Темная сторона: чем мощнее система, тем выше цена ошибки, тем важнее память, контроль, review и дисциплина.
Поэтому Codex действительно может стать монстром продуктивности. Но монстру нужна цепь. Git. Worktrees. Review. Permissions. Skills. Automations. И память.
Иначе вместо личной команды AI-сотрудников получится очень быстрый отдел стажеров, где все уверенно работают, но никто не помнит, зачем.