🚀 GPT-image 2 — генератор картинок от OpenAI, который наконец умеет писать

21 апреля OpenAI выкатили новую версию генератора картинок, GPT-image 2

Главное отличие от предыдущих версий — текст на изображениях перестал ломаться. Теперь кириллица, типографика, надписи на постерах создается без лишних артефактов и не требует ручной доработки в редакторе

Особенности

— Текст. Кириллица без искажений, заявленная точность выше 99%

— Цвета. Убрали характерный жёлтый фильтр, цветопередача стала нейтральной

— Знание мира. Реальные бренды и интерфейсы воспроизводятся точно

— Персонаж. Лицо сохраняется между разными сценами и форматами

— Скорость. Генерация примерно в 2 раза быстрее, чем у GPT Image 1.5

Ограничения

1. Модель работает лучше всего с 3 базовыми форматами соотношения сторон: 1:1, ~3:2, ~2:3

2. Были несколько кейсов во время теста, когда модель добавляла лишний текст. Необходимо прописывать запрет в промте

3. На редких или нишевых темах бывают галлюцинации

Тарифы: доступно для всех планов. На аккаунте с бесплатной версией уперся в лимит после 10 генераций

Итого, результаты генерации порадовали. Не ожидал такого качества с кириллицей, а также удивили скорость генерации. Результаты прикрепил, тонна текста на примере газеты "Коммерсантъ" расписана без ошибок :)

ТГ-канал, где сложные ИИ темы становятся простыми, а промты экономят уйму времени⬇

Начать дискуссию