{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию Статьи редакции

Её уже прозвали главным конкурентом аналогичной нейросети DALL-E от OpenAI.

Google представила нейросеть Imagen, которая генерирует изображения на основе текста. Для этого используется метод диффузии: всё начинается с простого, можно сказать схематичного изображения, которое потом улучшается — до тех пор, пока ИИ не решит, что не может сделать его ещё более похожим на заданные параметры.

Imagen начинает с создания небольшого (64×64 пикселя) изображения, а затем выполняет два прохода «сверхвысокого разрешения», чтобы довести его до размера 1024×1024. Однако это не похоже на обычное масштабирование, поскольку суперразрешение AI создает новые детали на картинке, чтобы сделать её более похожей на «техническое задание», прописанное в текстовом запросе.

«Белоголовый орлан из шоколадного порошка, манго и взбитых сливок»
«Хромированная утка с золотым клювом спорит со злой черепахой в лесу»
«Милый корги живет в доме, сделанном из суши»

Например, если дать Imagen задание создать изображение собаки на велосипеде, то в его первой версии размер глаза пса будет иметь ширину 3 пикселя, во второй — уже 12 пикселей, а в третьей — все 48 пикселей. Получается, ИИ работает подобно художнику, который начинает с грубого наброска, постепенно дополняя деталями и масштабируя.

«Крайне злая птица»
«Мраморная статуя ди-джея Коала перед мраморной статуей проигрывателя. Коала носит большие мраморные наушники»
«Гигантская змея-кобра на ферме. Змея сделана из кукурузы»
«Талисман Android из бамбука»

В Google утверждают, что созданная компанией нейросеть генерирует изображения по описанию с «беспрецедентным фотореализмом». Создатели Imagen сами сравнивают нейросеть с DALL-E 2 — аналогичным ИИ, создающим изображения на основе текста, от OpenAI.

По оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности. Компания предложила группе тестировщиков сравнить иллюстрации, созданные при помощи Imagen, DALL-E 2 и других моделей преобразования. Эксперимент показал, что люди чаще всего отдавали предпочтение изображениям, сгенерированным нейросетью Google.

«Панда, создающая арт-латте»: слева — версия DALL-E, справа — Imagen

Однако нейросеть от OpenAI опережает аналогичную от Google, поскольку уже появляется полноценной, хоть и закрытой бета-версией, и люди используют её для выполнения повседневных задач и развлечения.

При этом разработчики Imagen изначально озаботились моральными проблемами, которые могут возникнуть в случае, если текстовое задание будет содержать неприемлемые материалы и, таким образом, усугублять имеющиеся в обществе предрассудки и стереотипы.

Потенциальные риски неправильного использования вызывают опасения в отношении открытого исходного кода кода и демонстраций. Поэтому мы решили пока не публиковать код и не проводить публичную демонстрацию.

разработчики Imagen

Требования к данным для моделей преобразования текста в изображение заставили исследователей в значительной степени полагаться на большие, в основном неконтролируемые наборы данных, извлечённые из Интернета. Хотя этот подход позволил в последние годы добиться быстрого прогресса в области алгоритмов, наборы данных такого рода часто отражают социальные стереотипы, уничижительные и вредные ассоциации с маргинализованными группами.

Разработчики Google использовали набор данных LAION-400M, который, как известно, содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские оскорбления и вредные социальные стереотипы. Imagen полагается на текстовые кодировщики, обученные на неконтролируемых данных веб-масштаба, и, таким образом, наследует социальные предубеждения и ограничения больших языковых моделей.

Imagen пока находится на стадии тестирования: на сайте доступна демо-версия, в которой пользователи не могут сами вводить запросы, а способны лишь выбирать слова из предложенных. Когда Google предложит желающим воспользоваться Imagen, пока неясно.

«Голубая сойка стоит на большой корзине с радужными макаронами»
«Сиба-ину в кожаной куртке и шляпке катается на скейтборде»
«Картина маслом, на которой енот в красной рубашке и ковбойской шляпе катается на скейтборде на вершине горы»
«Британская короткошерстная кошка в кожаной куртке и ковбойской шляпе катается на велосипеде»
«Панда в чёрной кожаной куртке и солнечных очках играет на гитаре в парке»
«Пара роботов ужинает на фоне Эйфелевой башни»
«Осьминог-инопланетянин проплывает через портал, читая газету»
«Кружка-клубника, наполненная семенами белого кунжута плавает в море тёмного шоколада»
0
102 комментария
Написать комментарий...
Кот Будущего

"Поэтому мы решили пока не публиковать код и не проводить публичную демонстрацию."
красивое...

Ответить
Развернуть ветку
Александр Дизайнер

Миллион китайцев рисует картинки в Фотошопе за пару минут ...

Ответить
Развернуть ветку
4 комментария
Даюза Мильен

Красивое...
И нужное...
У меня первая мысль была Саша Грей в ковбойской шляпе... Окончание, пожалуй, не буду дописывать)))

Ответить
Развернуть ветку
4 комментария
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
lakoros

"на сайте доступна демо-версия, в которой пользователи не могут сами вводить запросы, а способны лишь выбирать слова из предложенных"
Можно покликать по пяти уже нарисованным картинкам. О ну прям сразу видно ИИ, нейросеть и вот это всё.

Ответить
Развернуть ветку
Александр Помидоров

5 условий if и else.

Ответить
Развернуть ветку
3 комментария
Пришелец

Ну если бы реально работало прям как они описали, то это была бы революция во многих сферах.

Ответить
Развернуть ветку
1 комментарий
Михаил

If else

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alexander Weber

Эпоха фотостоков уходит в прошлое, когда нейросеть нарисует тебе любую дичь по по твоему описанию. 《Нейросеть, покажи откуда готовилось нападение》

Ответить
Развернуть ветку
Даюза Мильен

Боюсь, что ответы на такие запросы будут уже зашиты в тело движка, как константа, дабы не оконфузиться перед своими господами.

Ответить
Развернуть ветку
2 комментария
Владимир Степанов

Скоро текстовое общение вымрет и будем общаться картинками

Ответить
Развернуть ветку
Аноним Аркадьевич

Сколько можно сделать супер дорогих NFT! Сколько людей наскамить!

Ответить
Развернуть ветку
Даюза Мильен

Таки для этого не нужен генератор картинок, не???

Ответить
Развернуть ветку
3 комментария
Игорь Крафт

Жигули подушка 0 евро палка газ народ сдавать дорого

Ответить
Развернуть ветку
Сергей Мазур
Ответить
Развернуть ветку
1 комментарий
Aleksandr Makarov

Как заклинание прочитал.

Ответить
Развернуть ветку
Кот Будущего

для этого и генератор не нужен, на алиэкспрессе наверняка найдется

Ответить
Развернуть ветку
C Ever

А как работает ИИ с нейросетью, когда менеджер ставит задачу, что сгенерировать нужно вчера?

Ответить
Развернуть ветку
Alexander Weber

Меняет дату сгенерированного файла на один день на "вчера" и отправляет по почте сегодня 💁🏽‍♂️

Ответить
Развернуть ветку
1 комментарий
Bezoblachno

Ещё десять лет и начнется эра самодельных фильмов

Ответить
Развернуть ветку
C Ever

Написал сценарий - и фильм сам снимается....

Ответить
Развернуть ветку
7 комментариев
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
DxdV

Да там буквально под картинками написано как в оригинале текст задан

Ответить
Развернуть ветку
6 комментариев
Anonymus

Вдруг понял что главные утечки будущего это не персданные (это скучно), а корпоративные нейросети. Это будет веселое время )

Ответить
Развернуть ветку
Barone Rosso

Теперь представьте что с вашими персональными данными может сделать развитая нейросеть? Например сгенерировать компрометирующее видео, цифровые следы, фейки. Есть куда разгуляться фантазии.

Ответить
Развернуть ветку
Сексорцист Милфхантерович

Пожалуйста не генерируйте фурри.

Ответить
Развернуть ветку
Please be patient ihave autism
Ответить
Развернуть ветку
Вадим Д.

Ой, не зря они опасаются (-:
Начнут так её испозовать, что Сальвадору нашему Дали и присниться не могло.

Ответить
Развернуть ветку
Даюза Мильен

Так появится специализация: создатель тестовых образов для генерации картинки.
Похоже что людям в скором времени останется только лечь в капсулы и подпитывать ИИ энергией.
Только перед этим надо не забыть нажать кнопку получения импульсов для поступления серотонина.
Лишь бы не вымерли, как те крысы, которым дали кнопку от оргазма.

Ответить
Развернуть ветку
3 комментария
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
VISAMARKT

Если бы в 4K и вектор конвертила, то была бы польза. А так, в стоках быстрее можно найти.

Ответить
Развернуть ветку
Useforlogin

Вопрос мощностей видеокарт.

Какой-нибудь vqgan на 16gb Tesla падает, если задать размер картинки 800х600. Но это пока. Через несколько лет будут доступны большие мощности.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Пришелец

«Панда, создающая арт-латте»: слева — версия DALL-E, справа — Imagen
Кажется, тут наоборот должно быть

Ответить
Развернуть ветку
Аполлон Степанов

Тут недавно статья была про генерацию логотипов. Какой мусор генерировала она, и какую красоту генерирует нейронная сеть Гугла.

Качество разработки наших и ихних это небо и земля.

Ответить
Развернуть ветку
Александр Каховский

Индийские и китайские фрилансеры

Ответить
Развернуть ветку
Wonabeez Doratie

Зимой голод будет, нейросеть им нагенерит хлеба?

Ответить
Развернуть ветку
alex b

Зачем? Подключаемся к капельницам с физраствором и ИИ сам решит когда и сколько еды кому выдать

Ответить
Развернуть ветку
Rudolf Boiars

Все мы знаем, что Сбер получше справляется😂

Ответить
Развернуть ветку
C Ever

Фильм "Отроки во Вселенной", 1974 год:
"...На борту оказываются человекоподобные инопланетяне, трое из которых переходят на «Зарю», где раскрывают тайну катастрофы своей планеты. 250 лет назад их учёные создали биотехнических роботов-исполнителей для выполнения тяжёлой и рутинной работы. Впоследствии были созданы и роботы-вершители, способные управлять роботами-исполнителями и совершенствовать их. Однажды роботы-вершители решили, что счастью людей («живых») мешают муки творчества, чувство неудовлетворённости, сострадание к другим, доброта и совесть. С помощью специальной процедуры «осчастливливания» роботы-вершители начали лишать жителей планеты этих качеств. Цивилизация оказалась на грани исчезновения, так как люди, лишённые чувства любви, перестали оставлять потомство и начали вымирать. Жители начали войну с роботами, но потерпели поражение. Роботы-вершители использовали так называемый «зов» — особое сочетание звуков и мелодий, лишавшее аборигенов воли и заманивающее их на пункты «осчастливливания». Спаслись только те, кто на момент катастрофы оказался в «космической радиообсерватории», которая и подала сигнал бедствия."

Ответить
Развернуть ветку
alex b

Сюда же можно цикл Основание Азимова подтянуть, там тоже по итогу выходит что людьми управляет робот, который обошел 1 закон робототехники и жизни людей его не волнуют

Ответить
Развернуть ветку
Алексей Галкин

Осталось заставить ИИ генерировать 24 картинки в секунду и можно кино не снимать.

Ответить
Развернуть ветку
Dimych Pupkin

хм, радужные макароны я себе представил совершенно иначе )))

Ответить
Развернуть ветку
Максим Гомбоев

Да, на русский коряво переводят это слово.

Ответить
Развернуть ветку
4 комментария
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Elena

Зато разрез глаз большинства авторов легко предсказать. Такое ощущение, что самая важная часть импортозависимости штатов от азии - это айти таланты))

Authors

Chitwan Saharia*, William Chan*, Saurabh Saxena†, Lala Li†, Jay Whang†, Emily Denton, Seyed Kamyar Seyed Ghasemipour, Burcu Karagol Ayan, S. Sara Mahdavi, Rapha Gontijo Lopes, Tim Salimans, Jonathan Ho†, David Fleet†, Mohammad Norouzi*
*Equal contribution. †Core contribution.

Ответить
Развернуть ветку
High Stakes

Скатерть-самобранку давайте уже.

Ответить
Развернуть ветку
Илья Попов

Супер, супер и тысяча раз супер!!!

Ответить
Развернуть ветку
Лев Коптев

Скандальный актер фильма Жмурки лежит на кровати. Рядом с ним большая собака.

Стоп, это уже было

Ответить
Развернуть ветку
Правильный Взгляд

«Панда в чёрной кожаной куртке и солнечных очках играет на гитаре в парке» - прямо картинка из фильма "Мёртвые до востребования" (

Ответить
Развернуть ветку
alex b

Окей гугл. Фото голой Эммы Уотсон, а то фанаты заждались

Ответить
Развернуть ветку
Вадим Амосов

Между строк - всем кто связан с дизайном, картинками и т.д. - ищите новую работу, у вас осталось максимум 2-3 года. И это не шутка!!! Изображение сгенерировано нейросетью по запросу "Лиса и кот"

Ответить
Развернуть ветку
Elena

Как минимум нейронки станут маст-хэв инструментом вместо слоев и стилей фотошопа.

Ответить
Развернуть ветку
Михаил Пономаренко
Ответить
Развернуть ветку
Никита Борисов

Нейросеть, нарисуй курс рубля(а, стоп, это уже сделали)

Ответить
Развернуть ветку
Дмитрий Ткачев

Ну хоть нейросети смогут показать нам хорошую жизнь

Ответить
Развернуть ветку
Диана Земскова
Ответить
Развернуть ветку
Олег Малахов

Аниме робот пылесос

Ответить
Развернуть ветку
Игорь Власов

Нарисуй мне пожалуйста картинку инопланетянина

Ответить
Развернуть ветку
Тариел Барамидзе

Ёшкин кот

Ответить
Развернуть ветку
Костя

Pon

Ответить
Развернуть ветку
99 комментариев
Раскрывать всегда