{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

DTF

1 сен 2021 1.09.2021

Google представила технологию, которая повышает разрешение изображений до 16 раз без потери качества Статьи редакции

В основе технологии — диффузионные модели.

В блоге Google AI, посвящённом исследованиям и разработкам в области искусственного интеллекта, обнаружили демонстрацию технологии масштабирования изображений на базе диффузионных моделей.

Как работает алгоритм Google

Специалисты внутренней команды Brain Team представили два связанных алгоритма, которые генерируют фотографии высокой чёткости без потери качества.

Первый из них называется SR3 (апскейлинг посредством повторного уточнения). На вход подаётся картинка с низким разрешением, и нейросеть пытается увеличить её, добавляя шум.

Модель обучается методам искажения изображения, а затем поворачивает весь процесс вспять, постепенно удаляя шум для достижения заявленного результата.

Инженеры обнаружили, что SR3 превосходит существующие генеративные алгоритмы, такие как PULSE и FSRGAN, особенно при работе с портретами и фотографиями природы.

В компании не остановились на достигнутом и разработали ещё одну диффузионную модель под названием CDM. На этот раз нейросеть обучили миллионам изображений высокого разрешения из базы ImageNet.

Алгоритм использует каскадный подход и увеличивает фотографии в два этапа: с разрешения 32×32 -> 64×64 -> 256×256 (в 8 раз), либо с 64×64 -> 256×256 -> 1024×1024 (в 16 раз).

Google опубликовала примеры работы алгоритмов. На некоторых изображениях заметны графические артефакты, но в целом результат действительно удивляет. О коммерческом распространении технологии данных пока нет.

Изменение изображений с 32x32 до 256x256 Google

Портреты, сгенерированные из фотографий низкого разрешения Google

#новость #google

64 показа

43K открытий

12 репостов

178 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Denis Bystruev

1.09.2021

Чудес не бывает. Очки у чувака в первом видео частично пропали, а так норм.

Ответить

Развернуть ветку

Nathan Zachary

1.09.2021

Где видео?

Ответить

Развернуть ветку

Denis Bystruev

1.09.2021

mp4 в начале статьи. Полный адрес:

https://leonardo.osnova.io/b268202a-0bea-5416-888f-fd3cc9d4489b/-/format/mp4/

Ответить

Развернуть ветку

Всеволод Мирославский

1.09.2021

Что приведено на видео не совсем корректно. Изначально брали хорошее фото, качественно сжимали (без радужных пикселей). А какой результат будет на 10/10 шакалах? Там куча 🌈 пикселей (см. Картинку с екарным бабаем)

Ответить

Развернуть ветку

Александр Трофимов

2.09.2021

А зачем брать 10 тысяч раз перекодированный и пережатый файл, если задача не в этом?

Ответить

Развернуть ветку

Всеволод Мирославский

3.09.2021

Ну хорошо. Пусть не 10 тысяч раз перекодированное. Есть и более "жизненные" ситуации. К примеру, старые сюжеты с ТВ и ютуба. Где снимали в 360, (в лучшем случае в 480) качестве.
В большинстве случаев проще передать хороший поток, чем кодировать и декодировать данные...
А что, если эта технология дорисовывает кадр и может использоваться в качестве создания "Уникального" контента? (пиратить)

Ответить

Развернуть ветку

Всеволод Мирославский

1.09.2021

Стоит прищуриться и уже острые пиксели не видать. Моет, но тем не менее качество хорошее

Ответить

Развернуть ветку

Показать 178 комментариев . Вы видите только часть дискуссии

Написать комментарий...

175 комментариев

Раскрывать всегда