Дизайн и фронтенд — следующая цель OpenAI

Вчера OpenAI выкатили GPT Image 2. На первый взгляд очередной апдейт генератора картинок, но по факту штука, которая сразу встраивается в продуктовую работу

Главное — модель научилась рендерить текст внутри интерфейсов, да и сами интерфейсы в целом. Раньше любая попытка сгенерить UI ломалась на иероглифах вместо букв. Теперь текст стоит на местах, можно точечно вносить правки, в том числе на русском. Плюс за один проход выдаёт до 8 консистентных картинок в режиме thinking , выдерживая стиль и компоненты между экранами

На практике это выглядит так: кидаешь скриншот существующего интерфейса или описываешь словами что хочешь — получаешь за минуту флоу из 8 фотореалистичных макетов. Прям на них итерируешь, не уходя в кодинг-агент и не сжигая время и токены. Дальше с готовым визуальным ТЗ идёшь в Codex или CC. Либо обсуждаешь с дизайн-командой, показываешь заказчику...(юзкейсов масса)

Интересно куда это ведёт. По сути генерация картинок становится фронтендом для кодинг-агентов. Промпт теперь можно подавать не словами, а визуальными блоками, что быстрее и точнее. А еще уверен что придем к тому, что перед тем как что-то кодить, Codex сначала будет показывать как это будет выглядеть, ты выберешь, и только потом пойдёт код. Быстрее, дешевле, результат лучше

Отсюда понятен фокус OpenAI именно на UI. Для фото и артов давно есть Midjourney и Nano Banana, а задача с интерфейсами не решалась. Следующий шаг — связка GPT Image 2 с Codex в одном потоке

P.S. Промт для картинки был элементарный, запустил без режима Thinking, а с ним еще бодрее работает

"Сгенерируй флоу регистрации и онбординга для IOS приложения - личного ассистента, который помогает с FOMO от новостей про ИИ. Минималистичный UX, чистый современный UI"

Больше такого в моем ТГ

t.me