Nvidia показала нейросеть для «исправления» лица человека в видеозвонке

Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia.

Nvidia представила платформу Nvidia Maxine для разработки сервисов видеосвязи на базе искусственного интеллекта и с GPU-ускорением для улучшения потокового видео. Maxine будет обрабатывать звонки в облаке с помощью графических процессоров Nvidia и повышать качество звонков, говорят в компании.

Nvidia показала нейросеть для «исправления» лица человека в видеозвонке

Компания утверждает, что платформа поможет исправить некоторые из наиболее распространённых проблем при видеозвонках. В частности, Nvidia Maxine позволяет снизить требования к пропускной способности «до одной десятой от требований стандарта сжатия потокового видео H.264» — инструмент передаёт только «ключевые точки лица», а ИИ восстанавливает изображение в видео на другой стороне. Снижение требований позволит снизить расходы провайдеров на инфраструктуру, отметили в компании.

Nvidia показала нейросеть для «исправления» лица человека в видеозвонке
Nvidia показала нейросеть для «исправления» лица человека в видеозвонке

Кроме того, с помощью ИИ платформа может выравнивать лица и глаза звонящих так, чтобы они всегда были обращены в камеру, повысить разрешение видео и подавить фоновый шум. Также платформа может в реальном времени показывать субтитры и перевод речи.

Разработчики также смогут добавлять в свои сервисы функции, позволяющие пользователям заменить себя на анимированных аватаров — они будут в реальном времени повторять голос и тон участников видеозвонка.

Nvidia показала нейросеть для «исправления» лица человека в видеозвонке

Автоматическое кадрирование позволит показывать говорящего, даже если он отходит от экрана. Кроме того, используя диалогового ИИ на базе NVIDIA Jarvis SDK, разработчики смогут интегрировать виртуальных помощников с распознаванием и генерацией речи. Виртуальные ассистенты могут делать заметки, различные действия и отвечать на вопросы человеческим голосом.

Как отмечает издание, некоторые из этих функций есть и у других компаний. Сжатие видео и субтитры в реальном времени достаточно распространены, а Microsoft и Apple добавили выравнивание взгляда в Surface Pro X и FaceTime, пишет The Verge. Nvidia уже объявила о партнёрстве с первым клиентом — коммуникационной компанией Avaya.

3838
19 комментариев

Pied Piper

30
Ответить

Ждём когда нвидия сольёт сама себя, а Хуанг станет преподавателем в Рязанском техническом училище?

6
Ответить

Жду опцию полной замены меня на ненужных конф-коллах, чтобы только если по имени обращаются пинг приходил :) 

16
Ответить

Так зачем пинг? нейронка на паре RTX5090 уже полностью тебя заменит, а то ляпнешь ещё там что-нибудь невпопад, кожаный мешок.

15
Ответить

Так зацикли видео просто и все.

Ответить

Комментарий недоступен

3
Ответить