{"id":14289,"url":"\/distributions\/14289\/click?bit=1&hash=892464fe46102746d8d05914a41d0a54b0756f476a912469a2c12e8168d8a933","title":"\u041e\u0434\u0438\u043d \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u043b \u043f\u0440\u043e\u0434\u0430\u0436\u0438 \u043d\u0430 5%, \u0430 \u0441\u0440\u0435\u0434\u043d\u0438\u0439 \u0447\u0435\u043a \u2014 \u043d\u0430 20%","buttonText":"","imageUuid":""}

Нейросеть дня

13 окт 2023 13.10.2023

Нейросеть дня «DALL-E 3»: генерируйте изображения вместе с текстами прямо из ChatGPT

Нейросетями для генерации изображений уже никого не удивишь. На этом рынке царят Midjourney и Stable Diffusion, которые умеют почти всё, почти. Но есть одно слабое место, которое пока никто не победил, — тексты. Даже очень простые слова на изображениях даются с трудом, а со шрифтами вообще мрак. И тут на сцену выходит обновлённая DALL-E.

DALL-E 3 — это новая версия генеративной нейросети от OpenAI. Позволяет создавать любые изображения по текстовому описанию, и в отличие от конкурентов, неплохо справляется с текстами на изображениях. Старики помнят, что именно с DALL-E когда-то началась вся эта это нейролихорадка. Но потом ребята из OpenAI сфокусировались на ChatGPT и упустили рынок изображений.

Что умеет DALL-E 3:

Генерирует изображения высокого качества и реалистичности, держит пропорции и симметрию, даже знает сколько пальцев на руке
Намного лучше конкурентов справляется с текстами. До совершенства пока далеко, но на английском можно добиться приемлемого качества
Более точно следует промпту, меньше выдумывает
Хорошо справляется со сложными запросами на русском языке
Доступен прямо из интерфейса ChatGPT (только в платной версии)

Из минусов:

Отказывается генерить известных людей (оставим Папу Римского в покое)
Не хочет копировать стили ныне живущих художников
Больше заточена под анимацию, с фотореализмом чуть хуже
Нет инструментария редактирования и доработки сгенерированных изображений

Beta-версия DALL-E 3 доступна только в платной версии ChatGPT, но Microsoft любезно предложил поиграться с ней беслплатно на базе Bing. При регистрации даётся 25 ускоренных генераций (100 изображений), про деньги пока не говорят. В любом случае для использования из России потребуется VPN.

P.S. Размышления о будущем:
Не надо быть гением, чтобы догадаться, что DALL-E 3 создаётся для работы в связке с ChatGPT. Упор на тексты и жесткое соответствие промпту там не просто так. OpenAI делают универсальную нейросеть для простых людей, а не для дизайнеров и художников. Будущее, в котором ChatGPT не просто пишет текст, но и создаёт к нему изображения, совсем близко

-----

Авторские обзоры ИИ-инструментов несколько раз в неделю. Удобнее читать в Telegram — https://t.me/universe_ai

2K показов

912 открытий

3 комментария

Сергей Карелкин

14.10.2023

Классно, попробовал третью версию, но не совсем понял как делать именно не анимацию, а как будто настоящую картинку, может кто то знает?

Ответить

Развернуть ветку

Lilya ChanTale

3 мар

и нигде не пишут, работы в DALL-E 3 приватные или нет =( вижу свои генерации только я, или они попадают куда-то в общий доступ =(

Ответить

Развернуть ветку

Виктор Лучанский

7 мар

У меня есть подозрение, что изображения не генерятся, а ищутся готовые в какой-то большой базе по ключевым словам...

Ответить

Развернуть ветку

Написать комментарий...

0 комментариев

Раскрывать всегда