OpenAI наконец-то догнали Google? Тестируем новый GPT-Image-1.5: битва против Nano Banana Pro и Midjourney

OpenAI наконец-то догнали Google? Тестируем новый GPT-Image-1.5: битва против Nano Banana Pro и Midjourney

Весь 2025 год мы жили в странной реальности: если тебе нужна «художественная шедевральность» — ты идешь в Midjourney. Если нужна логика, идеальный текст и вменяемое редактирование — ты идешь к Google и их Nano Banana Pro. А ChatGPT с его старым DALL-E 3 плелся где-то в хвосте, годный разве что для быстрых мемов.

Но на днях OpenAI, похоже, надоело быть аутсайдерами в генерации картинок. Они выкатили GPT-Image-1.5. И судя по первым тестам, они целятся ровно в ту же нишу, где сейчас царит Google — в управляемость и текст.

Я решил проверить, стала ли новинка от OpenAI реальным конкурентом текущим топам или это просто очередной маркетинговый пшик.

Текст: Битва за читаемость

Главная фишка Nano Banana Pro, за которую его полюбили дизайнеры интерфейсов и маркетологи — это умение писать текст без ошибок. Ты просишь логотип с надписью «Coffee & Code», и Google рисует именно эти буквы, а не инопланетные иероглифы.

Я скормил ту же задачу новинке от OpenAI. Промпт сложный: «Программист в худи с надписью 'NO BUGS', на столе табличка 'DEADLINE: YESTERDAY'».

Промт: Программист в худи с надписью 'NO BUGS', на столе табличка 'DEADLINE: YESTERDAY'
Промт: Программист в худи с надписью 'NO BUGS', на столе табличка 'DEADLINE: YESTERDAY'

И знаете что? GPT-Image-1.5 справился. Если раньше (в DALL-E 3) это была лотерея 1 к 50, то теперь нейросеть выдает чистый, читаемый шрифт с первой попытки. OpenAI явно подтянули этот аспект, и теперь у Google появился первый реальный конкурент в нише «генерации макетов и логотипов».

Редактирование: «Ластик» против «Банана»

Google Nano Banana Pro недавно взорвал рынок своим режимом редактирования, где можно выделить объект и переодеть персонажа, не меняя его лицо. Это была киллер-фича, которой не было у других.

OpenAI ответили зеркально. В новой модели появился режим «Creative Studio». Я провел краш-тест: сгенерировал сложную сцену в офисе, а потом попросил нейросеть «надеть на главного героя строительную каску и перевести текст на русский язык».

Промт: Надеть на главного героя строительную каску Перевести текст на Русский язык
Промт: Надеть на главного героя строительную каску Перевести текст на Русский язык

Результат меня удивил. GPT-Image-1.5 не перерисовал картинку с нуля (как делали старые модели), а аккуратно вписал каску в существующее освещение и безошибочно перевёл весь текст. Работает это почти так же шустро, как у Google. Теперь генерация картинки — это не казино, где ты каждый раз дергаешь ручку и надеешься на чудо, а нормальный рабочий процесс. Сгенерировал базу -> поправил детали -> забрал в работу.

Кто в итоге король горы?

Давайте честно разложим рынок на конец 2025 года:

  1. Midjourney v7 — всё ещё король эстетики. Если вам нужен арт, от которого падает челюсть, кинематографичный свет и стиль «дорого-богато» — Миджорни пока недосягаем. Но он всё ещё неудобен для точечных правок.
  2. Google Nano Banana Pro — король логики и консистентности. Если вам нужно сгенерировать одного персонажа в десяти разных позах для презентации, Google справляется лучше всех. Он лучше держит лицо и детали.
  3. GPT-Image-1.5 — теперь это золотая середина. Он наконец-то научился писать текст и редактировать объекты не хуже Google, при этом оставаясь самым доступным (просто внутри чата).

Вердикт

OpenAI не убили конкурентов, но они закрыли своё самое слабое место. Если раньше я держал подписку на ChatGPT ради кода, а за картинками ходил к соседям, то теперь GPT-Image-1.5 закрывает 90% моих «бытовых» задач.

Смерть фотошопа всё ближе и дизайнерам придется подвинуться. Инструменты становятся слишком хорошими, чтобы их игнорировать.

А вы уже сравнивали новинку с Nano Banana Pro? Кто, по-вашему, лучше понимает контекст? Пишите в комментарии.

Nano Banano Pro
Nano Banano Pro
1
1
2 комментария