Протестировал бесплатный редактор изображений в чат-боте Qwen. Новинка от китайской компании Alibaba
Последние годы мы наблюдаем бум генеративных нейросетей. Они пишут тексты, создают музыку и даже рисуют картины. Но один из самых востребованных сценариев является работа с изображениями. Раньше, чтобы удалить лишний объект на фото или поменять фон, приходилось открывать фотошоп, знать инструменты и тратить время.
Сегодня это можно сделать буквально за пару секунд, просто описав словами, что нужно.
Рынок ИИ-инструментов растёт стремительно. Одним из таких сервисов стал Qwen-Image-Edit от китайской компании Alibaba. Это не просто редактор, а полноценный чат-бот, который понимает ваши инструкции и вносит нужные изменения в изображение.
Я протестировал возможности Qwen-Image-Edit, чтобы разобраться, как он справляется с разными задачами. Ниже написал подробный разбор.
Как получить доступ к Qwen-Image-Edit?
Инструмент работает прямо в браузере. Достаточно зарегистрироваться на сайте Qwen и загрузить первую фотографию. Есть бесплатный тариф с ограничениями, а для активной работы подойдут платные подписки.
Сайт: клик После регистрации необходимо на главной странице выбрать режим Image Edit.
Где включить: панель снизу от диалогового окна → Image Edit
Сколько это стоит?
Согласно действующей политике Alibaba, инструмент остаётся бесплатным при использовании нейросети через личный кабинет. При работе через API стоимость обработки одного изображения составляет около $0.045. При этом первые 100 изображений в течение 180 дней после активации Alibaba Cloud Model Studio предоставляются бесплатно. Подробнее об условия тарификации на сайте Alibaba.
Кроме того, Qwen Image Edit имеет открытый исходный код. Вы можете бесплатно скачать его и установить на своё локальное устройство, чтобы использовать нейросеть без ограничений. Ссылка на репозиторий.
Как работает Qwen-Image-Edit?
Вы загружаете картинку, выделяете нужную область или формулируете текстовый запрос, и алгоритм сам вносит изменения. Qwen-Image-Edit позволяет выполнять сложные задачи редактирования, используя одно изображение и инструкцию.
Среди основных возможностей сервиса:
▶ замена текста на изображении
▶ перенос стиля с одного изображения на другое
▶ виртуальная примерка объектов
▶ окрашивание старых черно-белых фотографий
▶ изменение объектов, их положения и других элементов на изображении
▶ изменение стиля изображения
Примеры работы нейросети
1. Замена или добавление текста на изображении
📍 Промт Напиши в табличке слово "внимание"
📍 Промт Напиши в табличке слово "attention"
Сервис позволяет легко менять или добавлять текст, но с русским языком есть ограничения. Всё-таки стоит понимать, что модель в первую очередь оптимизирована для китайского и английского языков. В моем тесте результат на русском был плохим, а на английском значительно лучше. Если текст нужно вносить на английском или китайском языках, то решение Qwen-Image-Edit отлично подойдет. В случае использования русского языка нужные результаты маловероятны.
2. Виртуальная примерка объектов
Пример от разработчиков Qwen:
Ниже мой пример.
📍 Промт Поменяй костюм на белый, но внешность человека не меняй
Нейросеть справляется с этой задачей хорошо. Одежда, аксессуары, положение тела человека меняются без явных визуальных ошибок. Воспринимается полученный результат естественно. Если человек не знает, что одежда на изображении была отредактирована нейросетью, догадаться об этом будет почти невозможно.
3. Окрашивание старых черно-белых фотографий
📍 Промт Сделай фото цветным
Сервис успешно выполняет эту задачу, превращая черно-белые снимки в цветные. Единственное, на что стоит обратить внимание — это материалы, из которых сделаны здания. После того как нейросеть добавила цвет, сложилось впечатление, что материал зеленых зданий, расположенных посередине изображения, уж слишком похож на современный металлопрофиль.
4. Изменение объектов и их положения
📍 Промт Добавь человеку книгу. Внешность человека при этом не меняй
Для теста я взял свою фотографию и попросил добавить книгу. После редактирования изображения нейросетью немного изменилась текстура рубашки. Но в целом изображение получилось хорошо.
5. Смена перспективы
Пример от разработчиков Qwen:
Мой пример ниже
📍 Промт Сделай фото слона на снимке сверху
Со сменой перспективы у нейросети также не было никаких проблем. Нейросеть отлично справилась со сменой перспективы.
Сильные и слабые стороны Qwen-Image-Edit по сравнению с аналогами
👍 Сильные стороны Qwen-Image-Edit
▶ Семантическое и визуальное редактирование. Анализирует контекст изображения и изменяет объекты так, чтобы результат выглядел естественно.
▶ Открытый исходный код. Можно интегрировать в свои приложения и адаптировать под специфические задачи.
▶ Быстрое редактирование. Изменения выполняются буквально за несколько секунд, что экономит время по сравнению с классическими редакторами. Например, Stable Diffusion или Midjourney требуют больше времени на обработку и выполнение задачи.
👎 Слабые стороны Qwen-Image-Edit
▶ Ограниченная поддержка русского языка. Редактирование текста в изображении на русском может быть неточным.
▶ Зависимость от качества исходного изображения. Низкое разрешение или артефакты снижают качество итогового результата.
▶ Меньшая гибкость в креативной генерации по сравнению с аналогами вроде Stable Diffusion или Adobe Firefly возможности для создания новых визуальных концепций ограничены.
Итог
Работа в Qwen-Image-Edit имеет смысл с учетом того, что в бесплатной версии отсутствуют серьезные ограничения. Хотя в будущем разработчики могут сократить лимиты, Qwen-Image-Edit на текущий момент вполне удобное решение для редактирования изображений, если вы не работаете с фотографиями на профессиональном уровне.
Нейросеть справляется с большинством бытовых задач: удалить объект, заменить фон, добавить детали или улучшить фото. Всё это без знаний фотошопа и за пару кликов.
Возможности Qwen image edit можно разделить на несколько направлений:
▶ Простые правки (убрать объект, заменить фон, поправить цвета, увеличить резкость) — тут нейросеть работает очень хорошо, на 8–9 из 10. В таких задачах дизайнеру уже почти нечего делать, разве что слегка доработать результат вручную. Для блогеров и бизнеса это реальная экономия времени и денег. Не нужно обращаться к дизайнеру ради мелкой правки.
▶ Сложные правки (реалистично дорисовать элементы, заменить большие части изображения, добавить людей/объекты, которых не было). Результат зависит от промпта и картинки. Средний уровень можно оценить на 6–7 из 10: иногда идеально, иногда видно «нейросетевость».
▶ Тонкая стилистика, фирменный стиль бренда, работа с композицией, уникальные иллюстрации — пока слабее: примерно 4–5 из 10. Здесь нейросеть скорее инструмент для ускорения работы, чем полноценная замена дизайнера.
Но в целом за такими сервисами будущее. Уже сейчас они доступны каждому, а в ближайшие годы наверняка будут встроены прямо в камеры смартфонов и привычные редакторы. Это полностью изменит то, как мы работаем с изображениями.