Вышла убийца Nano Banano от Open AI - GPT Image 1.5. И это... провал?
Вот и релизнулась громкая новая генерация картинок в ChatGPT, на которую OpenAI делают большую ставку - GPT-IMAGE-1.5. И нам обещали много интересного. Ну, давайте посмотрим, что у них получилось и сравним с главным конкурентом..
Что же нам обещали?
А обещали, что это новый флагманский генератор картинок: точнее правит загруженные фото, меняет только то, что попросили, и лучше сохраняет детали вроде света, композиции и внешности людей. Плюс генерация до 4x быстрее.
По качеству и управляемости обещания такие: лучше следует инструкциям (в том числе в сложных сценах, где важны связи между объектами), лучше рисует текст, включая мелкий и плотный, и в целом чаще выдает готовый результат (например, с кучей маленьких лиц и более естественным видом).
В интерфейсе добавили отдельное место для картинок в ChatGPT (в боковой панели): пресеты, трендовые подсказки, и опция разово загрузить свою похожесть, чтобы использовать ее дальше в новых генерациях. Также говорят, что можно запускать новые генерации, пока предыдущие еще считаются.
Для разработчиков это выходит в API как GPT Image 1.5: те же улучшения по редактированию и сохранению исходника, более стабильное сохранение логотипов и бренд-элементов, упор на маркетинг и ecommerce (варианты, сцены, ракурсы из одного исходного изображения). Еще заявили, что входные и выходные изображения в 1.5 на 20% дешевле, чем в GPT Image 1.
Проверим?
Давайте протестируем возможности новой модели в разных ситуациях и сравним с главным конкурентом - Nano Banano PRO.
🔥🔥🔥Кстати, все генерации я тестировал на платформе SYNTX AI. А по промокоду NEIROSKUF, вы заберете горячую скидку в 15% на любой тариф. Реально - все нейросети в одном интерфейсе, рекомендую!
1) Фотореализм по референсу и стилистика 70х
Промпт:
Что мы видим: GPT Image 1.5 очень четко следует условиям промта и старается максимально перенести референс, что в живой сцене смотрится более искусствено. Nano Banano - напротив, добавляет множество мелких деталей. Тут и потертость комбеза, и растрепанные волосы, и обилие бликов. Картинка выглядит в разы детализированнее.
2) Фотореалистичное селфи в горах по референсу
Промт:
Что мы видим: Опять же, Open AI натягивает глянец референса на изображение и мы получаем стандартное селфи и теряем эмоцию. Ну и, опять, детали, да.
3) Делаем ленту из изображений
Промт:
Что мы видим: Да, у Nano Banano определенно есть проблемы с сочетанием реализм+киберпанк, поэтому у GPT Image получились более интересные варианты генерации, но, тем не менее, множественность художественных надписей на кириллице мы пока не вывозим.
4) Клоны
Промт:
Что мы видим: Да, GPT Image смогла клонировать личность с референса, но, по сути, с задачей не справилась в сравнении с Nano Banano. Тут реально - все позы разные, одежда разная + отражение в зеркале завезли.
5) Гайдлайн
Промт:
Что мы видим: GPT Image 1.5 выдала очень хаотичный результат с поплывшими словами. И, опять, не справилась с промтом, т.к. точно был указан заголовок.
6) Набор стикеров
Промт:
Что мы видим: Вот мы и подбираемся к самому главному. Nano Banano - реально думающая модель. Причем, обе прочитали суть бренда "Нейроскуф", связали его с ИИ тематикой, но большинство стикеров GPT Image 1.5 - вообще мимо.
7) Визуальный кейс "как было - что сделали - что получили"
Промт:
Что мы видим: Nano Banano подошла к задаче более комплексно, описала весь процесс и дала соответствующие визуализации.
8) Поддельная кассета с забытой телепередачей
Промт:
Что мы видим: Задача на вкусовщину. В данном контексте - GPT Image 1.5 прошла тест на олдовость.
9) Я из другой ветки реальности
Промт:
Что мы видим: Обе модели справились с задачей, но, опять же, GPT Image 1.5 нагородил деталей ради деталей. У Nano всё органично и просто идеально вписывается в композицию.
10) Расширяем фото
Промт:
Что мы видим: GPT Image 1.5 из раза в раз сопротивляется органичной детализации изображения.
11) Вирусный превьюшник
Промт:
Что мы видим: Каждая модель справилась с задачей, но Nano Banano PRO придумала более живое решение и не перенесла одежду.
Дьявол кроется в деталях
По плюсам модель правда выросла. Во-первых, ушла эта вечная желтизна и грязный оттенок, из-за которого картинка выглядела как фильтр по умолчанию. Во-вторых, лица стали стабильнее: меньше странных асимметрий, реже ломает глаза и зубы, кожа не превращается в пластик после первой же попытки. И отдельно приятно, что с текстом наконец стало жить: короткие надписи, вывески, подписи на упаковке или интерфейсные элементы теперь чаще выглядят как текст, а не как набор похожих букв. В задачах в целом слушается неплохо: попросил поменять конкретную деталь - чаще меняет ее, а не переделывает все подряд.
Минусы при этом тоже хорошо видны, если рядом поставить Nano Banano PRO. На примере GPT Image 1.5 ощущение такое, что она больше рисует по инструкции, чем решает задачу целиком. Nano Banano PRO чаще сама додумывает композицию, понимает, какой элемент куда поставить, где уместнее акцент, где нужен воздух, где лучше другой ракурс или свет. Она все еще лучше держит общий контекст, особенно когда промпт длинный и там много условий: персонажи, окружение, атрибуты, текст, стиль, ограничения по цветам, плюс еще какие-то мелкие требования. У GPT Image 1.5 в таких промптах начинает плыть логика: то забывает часть условий, то путает элементы местами, то упрощает сцену, лишь бы собрать хоть что-то. И еще один заметный момент - детализация. У Nano Banano PRO чаще есть мелкие фактуры, аккуратные элементы, живые мелочи, которые делают картинку дороже. У GPT Image 1.5 это чаще сглажено и обобщено, особенно если просишь много объектов в кадре.
По скорости я разницы почти не заметил. Может, где-то она и быстрее в среднем, но в реальной работе это не тот фактор, который перевешивает качество и управляемость.
Зато по рынку перспектива есть: свое место модель займет. У нас особенно - из-за простого входа и привычки людей думать "чат гпт = нейросеть". Открыл, написал, получил. И если по лимитам генераций они не прижмут, как часто бывает у Nano Banano, это станет очень весомым плюсом: когда можно спокойно перебрать 10-20 вариантов и допилить правками, продукт резко становится полезнее.
Если отвечать, что использовать прямо сейчас - Nano Banano или GPT 1.5, то пока 100% Nano Banano PRO!