Не вдаваясь в технические подробности, DALL·E — это трансформер состоящий из одного декодера, который принимает на вход последовательность из 1280 токенов, где 256 содержат текст, в 1024 оставшихся — части изображения. По сути, алгоритм обрабатывает регионы изображения так же как слова в тексте, и генерирует новые изображения таким же образом, как GPT-3 генерирует новый текст.
Выключайте этот ваш ИИ, страшно уже
Не бойся, кожаный мешок, это просто картинки (пока)
Очередное чудесное применение перемножения матриц :)
Sunrise - это рассвет.
Sunset - закат.
Исправьте
Спасибо, без задней мысли написал!
Эта хуйня (выпадающий список) немного разочаровала канеш, видимо под каждый набор картинок нужно обучать и обучать
Когда в фотошопе появится, потоковым дизайнерам и художникам пизда. Вместо 5 таких можно сажать одного чтобы дорисовывал за нейросетью
а где можно потестить эту нейросеть, как на картинке?