{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

Nvidia показала нейросеть для «исправления» лица человека в видеозвонке Статьи редакции

Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia.

Nvidia представила платформу Nvidia Maxine для разработки сервисов видеосвязи на базе искусственного интеллекта и с GPU-ускорением для улучшения потокового видео. Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia и повышать качество звонков, говорят в компании.

Компания утверждает, что платформа поможет исправить некоторые из наиболее распространённых проблем при видеозвонках. В частности, Nvidia Maxine позволяет снизить требования к пропускной способности «до одной десятой от требований стандарта сжатия потокового видео H.264» — инструмент передаёт только «ключевые точки лица», а ИИ восстанавливает изображение в видео на другой стороне. Снижение требований позволит снизить расходы провайдеров на инфраструктуру, отметили в компании.

Кроме того, с помощью ИИ платформа может выравнивать лица и глаза звонящих так, чтобы они всегда были обращены в камеру, повысить разрешение видео и подавить фоновый шум. Также платформа может в реальном времени показывать субтитры и перевод речи.

Разработчики также смогут добавлять в свои сервисы функции, позволяющие пользователям заменить себя на анимированных аватаров — они будут в реальном времени повторять голос и тон участников видеозвонка.

Автоматическое кадрирование позволит показывать говорящего, даже если он отходит от экрана. Кроме того, используя диалогового ИИ на базе NVIDIA Jarvis SDK, разработчики смогут интегрировать виртуальных помощников с распознаванием и генерацией речи. Виртуальные ассистенты могут делать заметки, различные действия и отвечать на вопросы человеческим голосом.

Как отмечает издание, некоторые из этих функций есть и у других компаний. Сжатие видео и субтитры в реальном времени достаточно распространены, а Microsoft и Apple добавили выравнивание взгляда в Surface Pro X и FaceTime, пишет The Verge. Nvidia уже объявила о партнёрстве с первым клиентом — коммуникационной компанией Avaya.

0
19 комментариев
Написать комментарий...
Кирилл Качалов

Pied Piper

Ответить
Развернуть ветку
Андрей Суслов

Ждём когда нвидия сольёт сама себя, а Хуанг станет преподавателем в Рязанском техническом училище?

Ответить
Развернуть ветку
Sergei Soloviev

Жду опцию полной замены меня на ненужных конф-коллах, чтобы только если по имени обращаются пинг приходил :) 

Ответить
Развернуть ветку
Аккаунт отморожен

Так зачем пинг? нейронка на паре RTX5090 уже полностью тебя заменит, а то ляпнешь ещё там что-нибудь невпопад, кожаный мешок.

Ответить
Развернуть ветку
a ass
Ответить
Развернуть ветку
Пластиковое Окно

Так зацикли видео просто и все.

Ответить
Развернуть ветку
Sergei Soloviev

Зацикленное видео не так реалистично, плюс есть возможность пропустить прямое обращение :) 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
ahshit here wego again

Я тоже охерел

Ответить
Развернуть ветку
Сергей Подливчук

Последний мужик реально криповый. Исправьте плес:

Ответить
Развернуть ветку
Холден Колфилд

Я думаю российские реалии ближе к исправлению лица человека

Ответить
Развернуть ветку
Треугольный Илья

Вы про «поправить е*ало»?))

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
lexxi zoid

Если инвертировать шутку, будет актуальней

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alexandr Sedykh

Вангую следующая нейросеть будет подрисовывать недостающие кадры в очках при обрыве соединения с коптером

Ответить
Развернуть ветку
Артём Гущин

То самое чувство, когда фраза "Лицо попроще" выходит на новый уровень

Ответить
Развернуть ветку
Mike Bystroff

лицо в камеру, говорите

Ответить
Развернуть ветку
Вася Пражкин
 платформа может выравнивать лица и глаза звонящих так, чтобы они всегда смотрели прямо в камеру

Думаю, МИД "Глаза-то не отводи!" должен закупить такую систему.

https://www.youtube.com/watch?v=I-a3DcZHq8o

Ответить
Развернуть ветку
16 комментариев
Раскрывать всегда