OpenAI представила нейросеть DALL-E — она создаёт изображения по текстовому описанию

Например, «пятиугольные зелёные часы» или «кресло в форме авокадо».

Исследователи из OpenAI представили нейросеть DALL-E, которая создаёт изображения по текстовому описанию.

DALL-Е создана на архитектуре нейросети GPT-3 и может генерировать изображения, обрабатывая текстовые запросы на английском языке.

Например, DALL-E может создать коллекцию изображений по запросу «кресло в форме авокадо» или «пятиугольные зеленые часы».

Изображения на основе запроса «кресло в форме авокадо»
Изображения на основе запроса «кресло в форме авокадо»

DALL-E понимает сложные абстрактные комбинации, может изменять стиль изображений, а также способна создавать реалистичные фото и несуществующие объёкты.

Нейросеть способна не только генерировать изображение, но и достраивать любую прямоугольную область существующего изображения.

Бюст Гомера
Бюст Гомера

Название нейросети происходит от имени художника Сальвадора Дали и робота WALL-E от Pixar.

Материал дополнен редакцией
35
18 комментариев