Шуруповёрт из Cyberpunk 2077
Роботы Figure на кухне
Nothing Phone 3a
Робот-человек
Nikola всё
Uber для охраны
iPhone 16e
Смартфон Huawei с 3 экранами
Аниме: Улицы разбитых фонарей
Рикша Hyundai

DALL·E: что мы знаем о молодой и многообещающей нейросети?

С момента релиза DALL·E не раз попадала в топы новостей: нейросеть освоила навыки редактуры изображений, научилась распознавать запросы на русском и даже «сделала»‎ обложку для глянцевого журнала. А недавно разработчики анонсировали еще одно изменение — теперь созданные визуалы можно использовать для коммерческих целей.

Какой путь прошла DALL·E за полтора года — рассказываем и показываем в тексте. Ваши изображения, истории и размышления о будущем дизайна собираем в комментариях.

Ниже вы узнаете:

Чем знаменита DALL·E?

DALL·E — это нейросеть, которая умеет генерировать изображения по текстовому описанию. Первую версию разработчики из OpenAI представили в 2021 году. Тогда DALL·E создавала картинки, обрабатывая запрос пользователя на английском языке.

Для обучения использовали датасет из пар «текст+изображение» и нейронную сеть в 12 миллиардов параметров.

<i>Если ввести запрос «кресло в форме авокадо», нейросеть предложит следующие изображения. <a href="https://api.vc.ru/v2.8/redirect?to=http%3A%2F%2Fopenai.com%2F&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a> </i>
Если ввести запрос «кресло в форме авокадо», нейросеть предложит следующие изображения. Источник 

В ноябре того же года команда разработчиков, включая Лабораторию по искусственному интеллекту Сбербанка, выпустила генератор изображений по запросам на русском языке — ruDALL-E. Сейчас у нее уже несколько модификаций:

  • ruDALL-E Kandinsky — работает в приложениях «Салют» и Discord и генерирует изображения с помощью голосовых команд.
  • ruDALL-E Malevich — пожалуй, наиболее похожая на оригинальную DALL·E нейросеть. Принцип действия точно такой же: вводите текстовый запрос на русском языке, а ИИ возвращается с изображениями.
  • ruDALL-E Emojich — генерирует по текстовому описанию смайлики. Их можно использовать для стикеров, клипартов и прототипов.
<i>Изображение, сгенерированное телеграм-ботом ruDALL-E Malevich по запросу «дата-центр будущего». <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.me%2Fsber_rudalle_xl_bot&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Изображение, сгенерированное телеграм-ботом ruDALL-E Malevich по запросу «дата-центр будущего». Источник
<i>Изображение, сгенерированное телеграм-ботом ruDALL-E Malevich по запросу «сисадмин года». <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.me%2Fsber_rudalle_xl_bot&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Изображение, сгенерированное телеграм-ботом ruDALL-E Malevich по запросу «сисадмин года». Источник

В апреле 2022 года OpenAI представила DALL·E 2: качество картинок улучшилось до разрешения 1024х1024 пикселей, сократилось количество искажений и смазанных элементов. Еще нейросеть научилась редактировать уже готовые изображения: изменять композицию, тени и структуру.

<i>Нейросеть научилась удалять объекты, объединять непохожие друг на друга визуалы и создавать новые рисунки, опираясь на уже имеющиеся. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fopenai.com%2Fdall-e-2%2F&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Нейросеть научилась удалять объекты, объединять непохожие друг на друга визуалы и создавать новые рисунки, опираясь на уже имеющиеся. Источник

Что DALL·E 2 еще не умеет?

Конечно, нейросеть не совершенна. Так, например, пользователи обнаружили, что она не умеет считать. Если ввести запрос «семь красных яблок на стеклянном блюдце», то на картинке будет несколько яблок — но не факт, что именно семь. Также DALL·E 2 теряется, если запросить слишком много деталей.

Ниже попытки одного из пользователей получить изображение по сложному запросу: «маленький темноволосый мальчик, отдыхающий в постели, и седая пожилая женщина, сидящая в кресле рядом с кроватью у окна, сквозь которое льется солнце, диджитал-арт в стиле Pixar».

<i>Изображения по запросу. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.lesswrong.com%2Fposts%2FuKp6tBFStnsvrot5t%2Fwhat-dall-e-2-can-and-cannot-do&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Изображения по запросу. Источник

Коммерциализация диджитал-арта

В официальном сообщении компании о выпуске DALL·E 2 в бету говорится, что пользователи, которые получили доступ к нейросети, теперь могут использовать сгенерированные изображения в коммерческих целях. Чтобы протестировать нейросеть самостоятельно, нужно встать в лист ожидания — и ждать, когда вам повезет. Это бесплатно.

«Начиная с сегодняшнего дня (20 июля 2022 года), пользователи получают полное право на коммерческое использование изображений, созданных ими с помощью DALL·E, включая право на перепечатку, продажу и создание мерча.

Пользователи сообщили нам, что с помощью DALL·E они хотят генерировать иллюстрации для детских книг, визуалы в SMM, игровой концепт-арт, мудборды и раскадровки для фильмов», — отметили разработчики.

К такому ходу уже прибегли в журнале Cosmopolitan. На обложке нового выпуска не было селебрити, заголовков про моду и успех, стильных нарядов. Только подпись: «Встречайте первую в мире обложку журнала, созданную искусственным интеллектом». И примечание ниже: «Это заняло всего 20 секунд».

<i>Обложка Cosmopolitan, созданная нейросетью. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.cosmopolitan.com%2Flifestyle%2Fa40314356%2Fdall-e-2-artificial-intelligence-cover%2F&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Обложка Cosmopolitan, созданная нейросетью. Источник

Что дальше?

На фоне новостей о DALL·E 2 пользователи спорят о том, какое будущее ждет дизайн. Да, нейросеть все еще генерирует неидеальные изображения по текстовому запросу, но ее быстрое развитие очевидно. А скорость, с которой готовится визуал, впечатляет.

Разработчики DALL·E 2 говорят, что не претендуют на лавры дизайнеров. На лендинге DALL·E 2 они написали: «Мы надеемся, что DALL·E 2 даст людям возможность творчески самовыражаться. Нейросеть также помогла нам понять, как системы искусственного интеллекта видят и понимают наш мир. Это критически важно для нашей цели по созданию искусственного интеллекта, приносящего пользу человечеству».

Кстати, DALL·E — не единственная нейросеть по генерации изображений.

Креативы, которые генерирует нейросеть Midjourney, впечатляют своей сложностью и оригинальностью. Они больше похожи на произведения искусства, чем на созданную искусственным интеллектом иллюстрацию.

<i>Изображение, сгенерированное Midjourney по запросу «Ты можешь уснуть за две минуты». <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fincrussia.ru%2Fswitch%2Fmidjourney%2F&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Изображение, сгенерированное Midjourney по запросу «Ты можешь уснуть за две минуты». Источник

Также есть ИИ This Person Does Not Exist на основе нейросети StyleGAN от Nvidia. Система обработала миллионы портретов и теперь генерирует фото человеческих лиц, основываясь на собирательных образах людей. Это подходящее решение для тех, кто, например, ищет фейковые фото для отзывов или боится нарушить авторские права при использовании реальных фото. Каждый раз, когда вы перезагружаете страницу, ИИ создает новый портрет.

<i>Портрет, сгенерированный нейросетью This Person Does Not Exist. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fthispersondoesnotexist.com&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Портрет, сгенерированный нейросетью This Person Does Not Exist. Источник

У нейросети есть проблема с украшениями: она почти никогда не делает их одинаковыми и часто «срезает» на иллюстрации, оставляя только половину сережки. Но генерация нового портрета — дело пары секунд.

Еще одна интересная сеть — Colorize. Она раскрашивает черно-белые изображения в реалистичные цвета.

<i>Портрет, раскрашенный Colorize. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fcolorize.cc&postId=477130" rel="nofollow noreferrer noopener" target="_blank">Источник</a></i>
Портрет, раскрашенный Colorize. Источник

Сможет ли DALL·E и другие нейросети заменить живых дизайнеров, особенно после разрешения коммерциализировать иллюстрации? Давайте обсудим в комментариях.

Подпишитесь на блог Selectel, чтобы не пропустить новые обзоры, новости и кейсы из мира IT и технологий.

Читать также:

4444
37 комментариев

Комментарий недоступен

2

Это какие слова нарисованы?

2

Согласны абсолютно!
Вчера с коллегами смотрели на изображения, сгенерированные Midjourney, и это просто новый уровень дизайна.

1

Русский неофутуризм от midjourney

2

Русский неофутуризмПодскажите пожалуйста, где можно скачать полноразмерные оригиналы этих картинок?

На мой неискушённый взгляд, весьма неплохо, особенно цвета.

1

Все самое интересное начнется когда нейросеть научится читать сценарии игрового кино

Кстати - да. Все голливудские актеры , да и вообще - в топку. Написал сценарий - засунул в нейросеть и на выходе -готовый блокбастер. Скажем долларо за 100.

4
Раскрывать всегда
Apple отключит сквозное шифрование в iCloud для пользователей в Великобритании

После новостей о требовании местных властей предоставить доступ к зашифрованным данным пользователей iCloud по всему миру.

Источник: Apple / The Verge
1212
1010
22
11
11
Кровавое Mi-6 или это другое?
Всё под рукой: онлайн-калькулятор для ипотечного страхования

Кейс о том, как мы разработали удобный онлайн-инструмент для расчета условий страхования ипотеки. Рассказываем, с какими сложностями столкнулись и как решали проблемы.

Всё под рукой: онлайн-калькулятор для ипотечного страхования
HP установила обязательное 15-минутное ожидание на телефонной линии техподдержки — а через три дня отменила изменения из-за критики

Производитель компьютерной техники хотел сократить количество обращений.

Источник фото: Kozhikode Directory
3131
55
11
Бесят боты в поддержке
«Аэрофлот» запустит прямые рейсы на китайский Хайнань из Санкт-Петербурга, Казани и Уфы

На фоне роста турпотока из России.

88
Ozon начнёт удерживать с продавцов расходы на услуги курьеров, если покупатель не принял заказ или отменил его, когда курьер был в пути

Раньше продавец оплачивал «последнюю милю» — доставку до ПВЗ, постамата или в руки — только при успешной покупке или возврате.

Источник фото: РБК
88
33
11
Продавцы в свою очередь заявили, что они и не продавцы вовсе, а лица, предоставляющие услуги по передаче товаров на бартерной основе покупателям, тем самым уверяют, что к ним данная комиссия не относится. Ozon они рекомендовали заняться поиском тех самых продавцом, к которым они собрались применять комиссию.
Напоминаем продавцам маркетплейсов об обязательной маркировке товаров до 1 марта

С 1 марта 2025 года обязательной маркировке подлежат дополнительные товары легкой промышленности, включая детскую одежду, мужское и женское белье, халаты, купальники, колготки, носки и чулки, перчатки, галстуки и головные уборы, трикотажные и вязаные вещи.

Напоминаем продавцам маркетплейсов об обязательной маркировке товаров до 1 марта
22
«У нас электричество заканчивается»: директор по развитию ИИ «Яндекса» предупредил о нехватке энергии для обучения моделей

Эксперты отмечают, что дефицит может возникать в некоторых регионах, но проблем с производством электричества в стране нет.

Фото ТАСС
6060
88
11
Если Абхазии даром энергию не отдавать, то и Яндексу хватит. Хотя чего это я? Лучше Абхазии даром, а россиянам тариф повысить.
[]