Codex стал почти AI-супераппом для разработки. Но полный киберпанк пока у людей с MacBook

Еще недавно AI-кодинг выглядел просто: открыл чат, попросил написать функцию, получил код, потом полчаса объяснял модели, почему она опять решила переписать проект "для чистоты архитектуры". Классика. Цифровой стажер с синдромом великого реформатора.

Но Codex от OpenAI уже начинает выглядеть не как очередной чатик для кода, а как отдельная рабочая среда.

Код написать? Можно.
Тесты прогнать? Можно.
Ревью сделать? Можно.
Картинку или ассет сгенерировать через skill? Можно.
Автоматизацию поставить на расписание? Можно.
Подключить внешние инструменты через MCP, plugins и skills? Тоже можно.

И вот тут появляется интересный момент: Codex постепенно превращается в замкнутую систему, где не нужно прыгать между десятью сервисами. Не надо отдельно открывать чат, отдельно терминал, отдельно генератор картинок, отдельно документацию, отдельно ревью.

Всё начинает сходиться в одном месте. Звучит как мечта.

Но у любой мечты есть обратная сторона. Если раньше хаос был размазан по разным вкладкам, то теперь он аккуратно собран в одном приложении. Спасибо, стало удобнее паниковать.

И да, часть самых вкусных фич в апрельском обновлении сначала досталась счастливым обладателям MacBook. Windows-пользователям, как обычно, остается вспоминать великую фразу: ждать и надеяться.

Главная фича Codex app не в том, что модель стала еще умнее. Главная фича в том, что Codex становится командным центром для агентной разработки.

Официально OpenAI описывает Codex app как command center для agentic coding: агенты могут работать параллельно, в изолированных копиях кода, а пользователь переключается между задачами, смотрит изменения, комментирует diff и забирает результат.

Если по-человечески: ты больше не сидишь с одним агентом, как с репетитором по математике. Ты открываешь маленький цифровой офис. Одному агенту можно дать backend. Второму - frontend. Третьему - тесты. Четвертому - документацию. Пятому - попросить проверить, почему CI умер в углу и делает вид, что так и было.

Это уже не "напиши мне функцию". Это "разбери задачу на части и пусть цифровые джуны работают параллельно".

Worktrees: чтобы стажеры не дрались в одной комнате

Самое важное в этой истории не количество агентов, а изоляция. Codex использует worktrees - то есть отдельные рабочие копии проекта. Каждый агент работает в своей комнате и не топчется грязными ботинками по чужим изменениям.

Для обычного пользователя это звучит как техническая скука. Для человека, который видел, как AI-агент случайно переписывает соседний файл, это звучит как страховка жизни.

Потому что несколько агентов без изоляции - это не команда. Это детский сад с бензопилами. А worktrees позволяют хотя бы раздать им отдельные песочницы.

Вторая большая штука - это skills. Skill - это папка с инструкциями, ресурсами, скриптами и правилами, которые расширяют поведение агента. Через skills Codex может делать не только "напиши компонент", а выполнять более конкретные рабочие процессы.

OpenAI показывает skills для Figma, OpenAI docs, image generation, PDF, таблиц, документов, деплоя на разные платформы и других задач. И вот тут Codex становится интересен шире, чем просто для программистов. Потому что если агент умеет работать со skills, он превращается не в "нейросеть, которая пишет код", а в рабочий инструмент, которому можно объяснить процедуру.

Например:

собери UI по макету;
сгенерируй картинку для статьи;
проверь документацию;
подготовь деплой;
разложи задачу на план;
сделай ревью.

Это уже похоже на систему, где внутри одного приложения можно держать и код, и контент, и часть продуктовой рутины. Короче, Codex начинает пахнуть не IDE, а маленькой операционной системой для работы с AI-агентами.

Автоматизации в Codex позволяют запускать задачи по расписанию или триггерам. OpenAI приводит примеры вроде ежедневного разбора issues, поиска CI failures, release briefs и других скучных регулярных задач.

Звучит не так сексуально, как "агент сам написал приложение". Но в реальной работе именно скучные задачи обычно и убивают время. Каждый день посмотреть, что сломалось. Разобрать issue tracker. Проверить, почему тесты опять лежат. Подготовить короткую сводку. Найти повторяющиеся баги.

Если агент делает это сам, у человека появляется шанс заниматься не только тушением пожаров, но и чем-то похожим на развитие. Хотя, конечно, есть риск, что утром тебя будет ждать отчет: "я нашел 18 проблем, 7 сам создал, 3 героически исправил".

Самая эффектная часть апрельского обновления Codex - это computer use на macOS.

Если говорить по-человечески, агент может видеть экран, кликать, печатать и работать с приложениями своим курсором в фоне. Не просто "напиши команду в терминале", а реально использовать компьютер как рабочую поверхность. То есть ты ставишь длинную задачу, а агент где-то там в фоне открывает нужное, проверяет, кликает, тестирует, смотрит результат и не отбирает у тебя мышку, как злой демон удаленного доступа.

Плюс появился in-app browser: агент может открывать страницы прямо внутри Codex, получать визуальный feedback, смотреть документацию, проверять frontend, взаимодействовать с сайтами. Для интерфейсов это особенно вкусно: меньше прыжков между окнами, быстрее цикл "изменил, посмотрел, поправил".

И сюда же ложится генерация изображений. Codex можно использовать не только как "напиши код", но и как рабочее место, где для статьи, интерфейса, мокапа или карточки можно быстро получить ассет через image generation skill.

Вот здесь и начинается то самое ощущение замкнутой системы. Код, браузер, картинки, терминал, агенты, автоматизации, внешние инструменты через MCP и plugins. Всё постепенно стягивается в одно место.

А если ты на Windows, то тоже можешь радоваться будущему. Просто через стекло. С легким выражением лица человека, которому показали шведский стол, а потом сказали: "пока только для гостей с яблоком на крышке".

Вот тут начинается ян к этому инь. Чем больше Codex умеет, тем больше ему хочется доверить.

Сначала он пишет код. Потом гоняет тесты. Потом делает ревью. Потом генерирует картинки. Потом запускает автоматизации. Потом через MCP и plugins подключается к внешним сервисам.

А потом ты внезапно понимаешь, что у тебя в одном приложении живет штука, которая может читать проект, менять файлы, запускать команды, дергать инструменты и помнить часть контекста. Удобно? Да. Немного похоже на выдачу стажеру ключей от офиса, склада и кофемашины? Тоже да.

Поэтому главная проблема Codex будущего не в том, что он "заменит программистов". Главная проблема в том, что человек начнет слишком быстро нажимать approve. А мы уже проходили: если агент умеет действовать, он умеет и ошибаться действием.

И вот здесь появляется моя любимая боль: память.

Codex становится мощнее именно потому, что все больше работы можно делать внутри одной системы. Но чем больше агентов, skills, автоматизаций и долгих задач, тем сильнее расползается контекст.

Кто что решил?
Почему выбрали эту архитектуру?
Где обсуждали ограничения?
Какой агент уже пробовал этот подход и почему он не сработал?
Что вообще происходило в проекте неделю назад, пока ты делал вид, что контролируешь хаос?

Для этого я делаю Locus: persistent project-aware memory для AI coding tools.

GitHub: Magnifico4625/locus

Locus - это MCP-память для Claude Code, Codex CLI. Идея простая: AI-инструменты не должны каждое утро просыпаться с амнезией.

В Locus есть три слоя:

structural memory: карта файлов, экспортов и импортов;
semantic memory: важные решения, которые сохраняются явно;
episodic memory: история сессий, изменений и событий.

Для Codex уже есть one-command install:

Это не замена Codex. Это как внешний гиппокамп для цифровых стажеров, которые иначе каждую новую сессию спрашивают: "а мы кто, что строим и почему этот файл нельзя трогать?"

Codex идет к очень интересной точке. Он перестает быть просто помощником по коду и становится рабочей средой, где можно писать, проверять, ревьюить, генерировать ассеты, запускать автоматизации и расширять возможности через skills, MCP и plugins.

Светлая сторона: всё под рукой, меньше переключений, больше скорости, несколько агентов работают параллельно. Темная сторона: чем мощнее система, тем выше цена ошибки, тем важнее память, контроль, review и дисциплина.

Поэтому Codex действительно может стать монстром продуктивности. Но монстру нужна цепь. Git. Worktrees. Review. Permissions. Skills. Automations. И память.

Иначе вместо личной команды AI-сотрудников получится очень быстрый отдел стажеров, где все уверенно работают, но никто не помнит, зачем.

Codex стал почти AI-супераппом для разработки. Но полный киберпанк пока у людей с MacBook

Светлая сторона: Codex становится командным центром

Skills: когда Codex перестает быть только про код

Автоматизации: агент сам вспоминает, что пора работать

MacBook-ветка: полный киберпанк уже рядом

Темная сторона: если всё в одном месте, ошибаться тоже удобнее

Где тут Locus

npx -y locus-memory@latest install codex

Вывод