{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

24 мая 2022 24.05.2022

Google разработала нейросеть Imagen, которая генерирует картинки по текстовому описанию Статьи редакции

Её уже прозвали главным конкурентом аналогичной нейросети DALL-E от OpenAI.

Google представила нейросеть Imagen, которая генерирует изображения на основе текста. Для этого используется метод диффузии: всё начинается с простого, можно сказать схематичного изображения, которое потом улучшается — до тех пор, пока ИИ не решит, что не может сделать его ещё более похожим на заданные параметры.

Imagen начинает с создания небольшого (64×64 пикселя) изображения, а затем выполняет два прохода «сверхвысокого разрешения», чтобы довести его до размера 1024×1024. Однако это не похоже на обычное масштабирование, поскольку суперразрешение AI создает новые детали на картинке, чтобы сделать её более похожей на «техническое задание», прописанное в текстовом запросе.

«Белоголовый орлан из шоколадного порошка, манго и взбитых сливок»

«Хромированная утка с золотым клювом спорит со злой черепахой в лесу»

«Милый корги живет в доме, сделанном из суши»

Например, если дать Imagen задание создать изображение собаки на велосипеде, то в его первой версии размер глаза пса будет иметь ширину 3 пикселя, во второй — уже 12 пикселей, а в третьей — все 48 пикселей. Получается, ИИ работает подобно художнику, который начинает с грубого наброска, постепенно дополняя деталями и масштабируя.

«Крайне злая птица»

«Мраморная статуя ди-джея Коала перед мраморной статуей проигрывателя. Коала носит большие мраморные наушники»

«Гигантская змея-кобра на ферме. Змея сделана из кукурузы»

«Талисман Android из бамбука»

В Google утверждают, что созданная компанией нейросеть генерирует изображения по описанию с «беспрецедентным фотореализмом». Создатели Imagen сами сравнивают нейросеть с DALL-E 2 — аналогичным ИИ, создающим изображения на основе текста, от OpenAI.

По оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности. Компания предложила группе тестировщиков сравнить иллюстрации, созданные при помощи Imagen, DALL-E 2 и других моделей преобразования. Эксперимент показал, что люди чаще всего отдавали предпочтение изображениям, сгенерированным нейросетью Google.

«Панда, создающая арт-латте»: слева — версия DALL-E, справа — Imagen

Однако нейросеть от OpenAI опережает аналогичную от Google, поскольку уже появляется полноценной, хоть и закрытой бета-версией, и люди используют её для выполнения повседневных задач и развлечения.

При этом разработчики Imagen изначально озаботились моральными проблемами, которые могут возникнуть в случае, если текстовое задание будет содержать неприемлемые материалы и, таким образом, усугублять имеющиеся в обществе предрассудки и стереотипы.

Потенциальные риски неправильного использования вызывают опасения в отношении открытого исходного кода кода и демонстраций. Поэтому мы решили пока не публиковать код и не проводить публичную демонстрацию.

разработчики Imagen

Требования к данным для моделей преобразования текста в изображение заставили исследователей в значительной степени полагаться на большие, в основном неконтролируемые наборы данных, извлечённые из Интернета. Хотя этот подход позволил в последние годы добиться быстрого прогресса в области алгоритмов, наборы данных такого рода часто отражают социальные стереотипы, уничижительные и вредные ассоциации с маргинализованными группами.

Разработчики Google использовали набор данных LAION-400M, который, как известно, содержит широкий спектр неприемлемого контента, включая порнографические изображения, расистские оскорбления и вредные социальные стереотипы. Imagen полагается на текстовые кодировщики, обученные на неконтролируемых данных веб-масштаба, и, таким образом, наследует социальные предубеждения и ограничения больших языковых моделей.

Imagen пока находится на стадии тестирования: на сайте доступна демо-версия, в которой пользователи не могут сами вводить запросы, а способны лишь выбирать слова из предложенных. Когда Google предложит желающим воспользоваться Imagen, пока неясно.

«Голубая сойка стоит на большой корзине с радужными макаронами»

«Сиба-ину в кожаной куртке и шляпке катается на скейтборде»

«Картина маслом, на которой енот в красной рубашке и ковбойской шляпе катается на скейтборде на вершине горы»

«Британская короткошерстная кошка в кожаной куртке и ковбойской шляпе катается на велосипеде»

«Панда в чёрной кожаной куртке и солнечных очках играет на гитаре в парке»

«Пара роботов ужинает на фоне Эйфелевой башни»

«Осьминог-инопланетянин проплывает через портал, читая газету»

«Кружка-клубника, наполненная семенами белого кунжута плавает в море тёмного шоколада»

#новость #нейросети #google #imagen

10 показов

84K открытий

1 репост

102 комментария

Написать комментарий...

Кот Будущего

24.05.2022

"Поэтому мы решили пока не публиковать код и не проводить публичную демонстрацию."
красивое...

Ответить

Развернуть ветку

Александр Дизайнер

24.05.2022

Миллион китайцев рисует картинки в Фотошопе за пару минут ...

Ответить

Развернуть ветку

4 комментария

Даюза Мильен

24.05.2022

Красивое...
И нужное...
У меня первая мысль была Саша Грей в ковбойской шляпе... Окончание, пожалуй, не буду дописывать)))

Ответить

Развернуть ветку

4 комментария

Аккаунт удален

24.05.2022

Комментарий недоступен

Ответить

Развернуть ветку

lakoros

24.05.2022

"на сайте доступна демо-версия, в которой пользователи не могут сами вводить запросы, а способны лишь выбирать слова из предложенных"
Можно покликать по пяти уже нарисованным картинкам. О ну прям сразу видно ИИ, нейросеть и вот это всё.

Ответить

Развернуть ветку

Александр Помидоров

24.05.2022

5 условий if и else.

Ответить

Развернуть ветку

3 комментария

Пришелец

24.05.2022

Ну если бы реально работало прям как они описали, то это была бы революция во многих сферах.

Ответить

Развернуть ветку

1 комментарий

Михаил

24.05.2022

If else

Ответить

Развернуть ветку

1 комментарий

Аккаунт удален

25.05.2022

Комментарий недоступен

Ответить

Развернуть ветку

Alexander Weber

24.05.2022

Эпоха фотостоков уходит в прошлое, когда нейросеть нарисует тебе любую дичь по по твоему описанию. 《Нейросеть, покажи откуда готовилось нападение》

Ответить

Развернуть ветку

Даюза Мильен

24.05.2022

Боюсь, что ответы на такие запросы будут уже зашиты в тело движка, как константа, дабы не оконфузиться перед своими господами.

Ответить

Развернуть ветку

2 комментария

Владимир Степанов

25.05.2022

Скоро текстовое общение вымрет и будем общаться картинками

Ответить

Развернуть ветку

Аноним Аркадьевич

24.05.2022

Сколько можно сделать супер дорогих NFT! Сколько людей наскамить!

Ответить

Развернуть ветку

Даюза Мильен

24.05.2022

Таки для этого не нужен генератор картинок, не???

Ответить

Развернуть ветку

3 комментария

Игорь Крафт

24.05.2022

Жигули подушка 0 евро палка газ народ сдавать дорого

Ответить

Развернуть ветку

Сергей Мазур

24.05.2022

Ответить

Развернуть ветку

1 комментарий

Aleksandr Makarov

24.05.2022

Как заклинание прочитал.

Ответить

Развернуть ветку

Кот Будущего

24.05.2022

для этого и генератор не нужен, на алиэкспрессе наверняка найдется

Ответить

Развернуть ветку

C Ever

24.05.2022

А как работает ИИ с нейросетью, когда менеджер ставит задачу, что сгенерировать нужно вчера?

Ответить

Развернуть ветку

Alexander Weber

24.05.2022

Меняет дату сгенерированного файла на один день на "вчера" и отправляет по почте сегодня 💁🏽‍♂️

Ответить

Развернуть ветку

1 комментарий

Bezoblachno

24.05.2022

Ещё десять лет и начнется эра самодельных фильмов

Ответить

Развернуть ветку

C Ever

24.05.2022

Написал сценарий - и фильм сам снимается....

Ответить

Развернуть ветку

7 комментариев

Аккаунт удален

24.05.2022

Комментарий недоступен

Ответить

Развернуть ветку

DxdV

24.05.2022

Да там буквально под картинками написано как в оригинале текст задан

Ответить

Развернуть ветку

6 комментариев

Anonymus

24.05.2022

Вдруг понял что главные утечки будущего это не персданные (это скучно), а корпоративные нейросети. Это будет веселое время )

Ответить

Развернуть ветку

Barone Rosso

25.05.2022

Теперь представьте что с вашими персональными данными может сделать развитая нейросеть? Например сгенерировать компрометирующее видео, цифровые следы, фейки. Есть куда разгуляться фантазии.

Ответить

Развернуть ветку

Сексорцист Милфхантерович

24.05.2022

Пожалуйста не генерируйте фурри.

Ответить

Развернуть ветку

Please be patient ihave autism

25.05.2022

Ответить

Развернуть ветку

Вадим Д.

24.05.2022

Ой, не зря они опасаются (-:
Начнут так её испозовать, что Сальвадору нашему Дали и присниться не могло.

Ответить

Развернуть ветку

Даюза Мильен

24.05.2022

Так появится специализация: создатель тестовых образов для генерации картинки.
Похоже что людям в скором времени останется только лечь в капсулы и подпитывать ИИ энергией.
Только перед этим надо не забыть нажать кнопку получения импульсов для поступления серотонина.
Лишь бы не вымерли, как те крысы, которым дали кнопку от оргазма.

Ответить

Развернуть ветку

3 комментария

Аккаунт удален

24.05.2022

Комментарий недоступен

Ответить

Развернуть ветку

VISAMARKT

24.05.2022

Если бы в 4K и вектор конвертила, то была бы польза. А так, в стоках быстрее можно найти.

Ответить

Развернуть ветку

Useforlogin

24.05.2022

Вопрос мощностей видеокарт.

Какой-нибудь vqgan на 16gb Tesla падает, если задать размер картинки 800х600. Но это пока. Через несколько лет будут доступны большие мощности.

Ответить

Развернуть ветку

Аккаунт удален

24.05.2022

Комментарий недоступен

Ответить

Развернуть ветку

Пришелец

24.05.2022

«Панда, создающая арт-латте»: слева — версия DALL-E, справа — Imagen
Кажется, тут наоборот должно быть

Ответить

Развернуть ветку

Аполлон Степанов

25.05.2022

Тут недавно статья была про генерацию логотипов. Какой мусор генерировала она, и какую красоту генерирует нейронная сеть Гугла.

Качество разработки наших и ихних это небо и земля.

Ответить

Развернуть ветку

Александр Каховский

25.05.2022

Индийские и китайские фрилансеры

Ответить

Развернуть ветку

Wonabeez Doratie

25.05.2022

Зимой голод будет, нейросеть им нагенерит хлеба?

Ответить

Развернуть ветку

alex b

25.05.2022

Зачем? Подключаемся к капельницам с физраствором и ИИ сам решит когда и сколько еды кому выдать

Ответить

Развернуть ветку

Rudolf Boiars

24.05.2022

Все мы знаем, что Сбер получше справляется😂

Ответить

Развернуть ветку

C Ever

24.05.2022

Фильм "Отроки во Вселенной", 1974 год:
"...На борту оказываются человекоподобные инопланетяне, трое из которых переходят на «Зарю», где раскрывают тайну катастрофы своей планеты. 250 лет назад их учёные создали биотехнических роботов-исполнителей для выполнения тяжёлой и рутинной работы. Впоследствии были созданы и роботы-вершители, способные управлять роботами-исполнителями и совершенствовать их. Однажды роботы-вершители решили, что счастью людей («живых») мешают муки творчества, чувство неудовлетворённости, сострадание к другим, доброта и совесть. С помощью специальной процедуры «осчастливливания» роботы-вершители начали лишать жителей планеты этих качеств. Цивилизация оказалась на грани исчезновения, так как люди, лишённые чувства любви, перестали оставлять потомство и начали вымирать. Жители начали войну с роботами, но потерпели поражение. Роботы-вершители использовали так называемый «зов» — особое сочетание звуков и мелодий, лишавшее аборигенов воли и заманивающее их на пункты «осчастливливания». Спаслись только те, кто на момент катастрофы оказался в «космической радиообсерватории», которая и подала сигнал бедствия."

Ответить

Развернуть ветку

alex b

25.05.2022

Сюда же можно цикл Основание Азимова подтянуть, там тоже по итогу выходит что людьми управляет робот, который обошел 1 закон робототехники и жизни людей его не волнуют

Ответить

Развернуть ветку

Алексей Галкин

24.05.2022

Осталось заставить ИИ генерировать 24 картинки в секунду и можно кино не снимать.

Ответить

Развернуть ветку

Dimych Pupkin

24.05.2022

хм, радужные макароны я себе представил совершенно иначе )))

Ответить

Развернуть ветку

Максим Гомбоев

25.05.2022

Да, на русский коряво переводят это слово.

Ответить

Развернуть ветку

4 комментария

Аккаунт удален

24.05.2022

Комментарий недоступен

Ответить

Развернуть ветку

Elena

25.05.2022

Зато разрез глаз большинства авторов легко предсказать. Такое ощущение, что самая важная часть импортозависимости штатов от азии - это айти таланты))

Authors

Chitwan Saharia*, William Chan*, Saurabh Saxena†, Lala Li†, Jay Whang†, Emily Denton, Seyed Kamyar Seyed Ghasemipour, Burcu Karagol Ayan, S. Sara Mahdavi, Rapha Gontijo Lopes, Tim Salimans, Jonathan Ho†, David Fleet†, Mohammad Norouzi*
*Equal contribution. †Core contribution.

Ответить

Развернуть ветку

High Stakes

24.05.2022

Скатерть-самобранку давайте уже.

Ответить

Развернуть ветку

Илья Попов

25.05.2022

Супер, супер и тысяча раз супер!!!

Ответить

Развернуть ветку

Лев Коптев

25.05.2022

Скандальный актер фильма Жмурки лежит на кровати. Рядом с ним большая собака.

Стоп, это уже было

Ответить

Развернуть ветку

Правильный Взгляд

25.05.2022

«Панда в чёрной кожаной куртке и солнечных очках играет на гитаре в парке» - прямо картинка из фильма "Мёртвые до востребования" (

Ответить

Развернуть ветку

alex b

25.05.2022

Окей гугл. Фото голой Эммы Уотсон, а то фанаты заждались

Ответить

Развернуть ветку

Вадим Амосов

25.05.2022

Между строк - всем кто связан с дизайном, картинками и т.д. - ищите новую работу, у вас осталось максимум 2-3 года. И это не шутка!!! Изображение сгенерировано нейросетью по запросу "Лиса и кот"

Ответить

Развернуть ветку

Elena

25.05.2022

Как минимум нейронки станут маст-хэв инструментом вместо слоев и стилей фотошопа.

Ответить

Развернуть ветку

Михаил Пономаренко

25.05.2022

Ответить

Развернуть ветку

Никита Борисов

25.05.2022

Нейросеть, нарисуй курс рубля(а, стоп, это уже сделали)

Ответить

Развернуть ветку

Дмитрий Ткачев

25.05.2022

Ну хоть нейросети смогут показать нам хорошую жизнь

Ответить

Развернуть ветку

Диана Земскова

12.02.2023

Ответить

Развернуть ветку

Олег Малахов

13.04.2023

Аниме робот пылесос

Ответить

Развернуть ветку

Игорь Власов

5.05.2023

Нарисуй мне пожалуйста картинку инопланетянина

Ответить

Развернуть ветку

Тариел Барамидзе

8.09.2023

Ёшкин кот

Ответить

Развернуть ветку

Костя

25.09.2023

Pon

Ответить

Развернуть ветку

Написать комментарий...

99 комментариев

Раскрывать всегда