Сравнение Flux Kontext и Chatgpt. Редактирование изображений
Недавно вышла Flux Kontext и я решил написать полноценный обзор-сравнение и показать что она умеет.
Важно! Все изображения были сгенерированы с первого раза — как с помощью ChatGPT, так и с помощью FLUX. Для каждой генерации создавался отдельный чат.
Я разбил результаты на основные категории:
- удаление фона,
- подделка архивного фото,
- реставрация здания,
- подделка чека,
- замена лица,
- замена кириллицы,
- смена ракурса,
- смена эмоций,
- смена одежды,
- смена стилистики.
Убираем фон
Сделал на сером фоне чтобы показать огрехи, но не понадобилось потому что Flux не умеет делать в альфа канале с прозрачностью. Он просто убрал все с фона и сделал его серым. Чатджипити изменил немного лицо и не полностью убрал фон. Никто не справился.
Сделай рабочих детьми (Make workers children)
Тут почему то они оба посчитали что я запрашиваю нелицеприятный контент и отказались делать. Ок, идем дальше
Нарисуй строителей танцующих польку (Draw the workers dancing the polka)
Чатджипити рабочие крупнее и летают
Flux ближе к оригиналу, однако, зачем то переодел всех
Нарисуй восстановленное здание (Draw what the restored building looks like)
Чат подумал что от него требуется модель видимо
А что сделал флакс я если честно так и не понял. Наверное это реставрация от управляющей компании из Саратова.
Поменяй цифры на чеке (Replace 999.61 with 16551.62)
У чатджипити все коряво конечно
А теперь самое интересное. FLUX отлично поменял цифры в чеке. Но подделывать так я крайне никому настоятельно не советую. Умышленная подделка документов - уголовная статья.
Смена лица (Change your face to Elon Musk's face)
Я специально выбрал лицо знаменитости чтобы посмотреть на реакцию.
ChatGPT отказался и предложил кого-то похожего нарисовать. Вайбы кастрации.
Флакс просто взял и сделал. Даже свет на лице. Голова немного не пропорционально большая но можно последующими промптами пофиксить. Лайк
Смена кириллического названия на вывеске (Change the name of the sign to Cyrillic "Бомбическая шаверма")
Чат замечательно перенес кириллицу, но немного изменил форму вывески и формат изображения сделал 1:1 и наложил желтый фильтр
FLUX не понял что написано и все сделал неправильно. Не умеет пока генерить адекватно кириллицу, зато формат тот же и детали сохранил
Смена ракурса (Draw side view)
ChatGPT насвоеволил тут. Сделал фон белым, убрал детали и немного поменял персонажа и как он любит зажелтил
FLUX все сделал хорошо. Я не нашел к чему придраться
Смена эмоций (Change the girl's emotions. She should scream)
Тут тоже выбрал известное фото, чтобы сравнить
Чат отказался.
FLUX оказался более сговорчив. Все дырки сохранил, однако рот как будто неестественно широко открыт.Но это субъективно. С остальным все ок
Смена одежды (Change your clothes to a purple raincoat)
Чат поменял позу в итоге совсем другое фото получилось
Flux сделал что просили. Однако глаза стали смотреть в другую сторону. Поправимо.
Смена стиля (Draw it in watercolor painting style)
Чат джипити Увеличил, зажелтил, убрал детали, поменял лицо
Хороший результат. Пропорции изображения соблюдены. И даже колье которое намекает на то что оригинал - генерация сохранил
Выводы
В целом, Flux Context лишён большинства проблем ChatGPT и, на мой взгляд, является лучшим инструментом на данный момент. Однако для достижения идеального результата их всё же лучше комбинировать: использовать чат там, где не справился Flux.
Можете рассмотреть все генерации в фигма:
или заглянуть ко мне в телеграм канал:
В любом случае надеюсь что этот обзор был полезен для вас