Видеоконференцсвязь сейчас — рынок и новые технологии. Лонгрид, часть вторая

Публикуем вторую часть обзора про рынок видеоконференцсвязи. Какие разработки появились за последний год, как они проникают в нашу жизнь и становятся привычными.

Выше скриншот видео SRI International, его можно будет посмотреть ближе к концу статьи.

  • Рынок ВКС — мировой срез
  • Аппаратные vs программные средства видеосвязи
  • Huddle rooms — аквариумы
  • Кто кого: слияния и поглощения
  • Не видео единым
  • Конкуренция или интеграция?
  • Сжатие и передача данных

Часть 2:

Умные конференции

Сфера ВКС довольно подвижна в плане внедрения новых технологий, множество разработок появляется каждый год. Существенно расширяют возможности машинное обучение и искусственный интеллект.

Самой близкой к реальности и востребованной стала технология speech-to-text. Четкую членораздельную речь машина распознает довольно успешно, а вот живую с разбором по голосам пока не очень. Однако видеосвязь упрощает процедуру последовательными репликами по разным каналам, и сервисы на базе распознавания речи уже анонсировали многие вендоры.

Помимо живых субтитров, которые удобны для слабослышащих людей или в общественных местах, бизнесу нужны также инструменты управления результатом совещаний. Тонны видео неудобно пересматривать, кто-то должен вести протокол, фиксировать договоренности, превращать их в планы. Пока еще человек помогает размечать и сортировать расшифрованный текст, но это уже значительно удобнее, чем записывать самому в блокнот. При необходимости пост-фактум искать в расшифрованных текстах и созданных метках гораздо легче. Интеграция с планировщиками и разными сервисами управления проектами ощутимо повышает эффективность средств видеосвязи. В этом направлении работают, например, Microsoft, BlueJeans. Cisco с этой целью купил компанию Voicea.

Из популярных функций стоит отметить замену фона. За спиной выступающего можно разместить любое изображение. Эта возможность появилась у различных производителей, в том числе у российского TrueConf, довольно давно. Раньше для ее реализации был необходим хромакей (зеленый баннер или стена) за спиной говорящего. Сейчас уже есть решения, которые могут обойтись и без него — например, Zoom. Буквально накануне выхода материала замену фона анонсировали в Microsoft Teams.

Microsoft также умеет делать людей прозрачными. В августе 2019 года в Teams Rooms появилась функция Intelligent Capture. Кроме основной камеры, которая предназначена для съемки людей, используется также дополнительная контент-камера, задача которой — транслировать изображение обычной маркерной доски, на которой выступающий может что-то писать или чертить. Если докладчик увлекся и загораживает написанное, система сделает его полупрозрачным и восстановит изображение с контент-камеры.

Intelligent Capture, Microsoft

Компания Agora сделала алгоритм распознавания эмоций. Система на базе облачного сервера обрабатывает видеоданные, выделяет на них лица и сообщает пользователю о том, какие эмоции сейчас демонстрирует собеседник. С указанием степени точности определения. Пока что решение работает только для общения в режиме один на один, но в будущем планируется реализовать такое и для многопользовательских конференций. В основе продукта — deep learning, в частности, используются библиотеки Keras и TensorFlow.

Распознавание эмоций от Agora

Принципиально новую сферу применения для систем видеоконференцсвязи открыла технология, которая понимает язык жестов. Приложение GnoSys создала компания Evalk из Нидерландов. Сервис распознает все популярные жестовые языки. Достаточно поставить телефон или планшет перед собой во время сеанса видеосвязи или обычного разговора. GnoSys будет переводить с языка жестов и воспроизводить вашу речь для собеседника, сидящего напротив или по ту сторону экрана. Информация о разработке Evalk появлялась в феврале 2019 года. Тогда партнером проекта выступила индийская ассоциация слабослышащих людей — National Deaf Association. Благодаря ее содействию разработчики получили доступ к огромному массиву данных о жестовых языках, диалектах и нюансах использования, шло активное тестирование в Индии.

Сейчас очень актуальным становится вопрос утечки конфиденциальной информации с переговоров. Zoom в начале 2019 года анонсировал внедрение ультразвуковой подписи. Каждое видео снабжается специальным ультразвуковым кодом, который позволяет отследить источник утечки информации в том случае, если запись попадет в Интернет.

Виртуальная и дополненная реальность тоже проникают в сферу видеоконференцсвязи. Microsoft предлагает использовать новые очки HoloLens 2 вместе со своим облачным сервисом совместной работы Teams.

HoloLens 2, Microsoft

Бельгийский стартап Mimesys пошел еще дальше. Компания разработала технологию виртуального присутствия, которая позволяет создать модель человека (аватар) и поместить его в общее рабочее пространство, наблюдать за которым можно при помощи очков виртуальной реальности. Mimesys приобрела компания Magic Leap — известный на мировом рынке производитель VR-очков. Эксперты отрасли прочно увязывают перспективы развития технологий виртуальной и дополненной реальности с развитием мобильных сетей 5G, поскольку только они смогут обеспечить необходимую скорость и надежность работы, чтобы подобные сервисы стали доступны широкому кругу заказчиков.

Совместная работа над проектом в виртуальной реальности, фото Mimesys

Необычные кейсы. Управление роботами и охрана порядка

В заключение немного о том, как расширяется сфера применения видеосвязи. Самое очевидное — это дистанционное управление механизмами в опасной зоне и некомфортных средах, избавление людей от опасной или рутинной работы. В новостном поле за последний год встречались темы управления, например, роботами телеприсутствия в космосе, роботами-помощниками по дому, БЕЛАЗами в угольном разрезе. Развиваются решения для пенитенциарной и правоохранительной систем.

Так недавно появилась информация о новой разработке исследовательского института SRI International (США), где проблема безопасности полицейских стоит довольно остро. По статистике, каждый год со стороны агрессивных водителей на стражей правопорядка осуществляется порядка 4,5 тыс. нападений. Примерно каждый сотый из этих случаев заканчивается гибелью полицейского.

Разработка представляет собой комплексную систему, которая крепится на патрульной машине. Она оснащена камерами высокого разрешения, дисплеем, динамиками, и микрофонами. Есть также алкотестер, сканер для проверки подлинности документов и принтер для выдачи штрафных квитанций. Поскольку монитор комплекса сенсорный, с его помощью можно провести специальные тесты, позволяющие оценить общее состояние и адекватность водителя. Когда полицейский экипаж останавливает нарушителя, устройство выдвигается в сторону проверяемого автомобиля и блокирует его перемещение до завершения всех проверочных процедур с помощью специальной шипованной планки на уровне колес. Система уже проходит завершающие испытания.

Роботизированная система проверки автомобилей, SRI International

Еще одной средой применения ВКС стали тюрьмы. Несколько пенитенциарных заведений США в штатах Миссури, Индиана и Миссисипи заменили для заключенных обычные короткие свидания на общение через терминал видеосвязи.

Общение через терминал ВКС в одной из тюрем США, фото Natasha Haverty, nhpr.org

Тюрьмы таким образом не только повышают безопасность, но и сокращают расходы. Ведь для того чтобы доставить заключенного в комнату для свиданий и обратно, необходимо обеспечить целый комплекс мер безопасности на всем пути следования и во время общения. Поскольку в тюрьмах США свидания разрешены раз в неделю, то для крупных объектов с большим контингентом обеспечение этого процесса происходит практически непрерывно. Если заменить личные свидания видеосвязью, то потенциальных проблем станет меньше, да и штат конвоиров можно сократить.

Правозащитники и сами заключенные говорят, что в нынешнем варианте система видеосвязи существенно проигрывает личному общению и никак не является его эквивалентом, даже несмотря на увеличенное время разговора. Родственникам не обязательно ехать в тюрьму, общение можно вести из дома, но в этом случае стоимость связи существенно дороже — от нескольких десятков центов до десяти долларов США за минуту в зависимости от региона. Пообщаться через локальные терминалы на территории тюрьмы можно бесплатно.

Тюрьмы, которые попробовали внедрить у себя подобные системы связи, очень довольны результатом и не планируют отказываться от данной практики. Независимые источники отмечают, что администрация может быть заинтересована во внедрении технологии из-за комиссии от операторов ВКС, которые устанавливают там свои решения. Во всех случаях речь идет о специальных закрытых системах, качество которых, по отзывам американских журналистов, уступает популярным сервисам вроде Skype.

Рынок ВКС будет продолжать расти. Особенно это очевидно теперь, в разгар эпидемии. Выход в облака открыл возможности, которые еще не реализованы в полной мере, а на подходе уже новые технологии. Видеоконференцсвязь «умнеет», интегрируется в общее деловое пространство и продолжает совершенствоваться.

Благодарим Игоря Кириллова за подготовку материала и редакцию В+К за его актуализацию.

0
4 комментария
Vladislav Orlikov

Что-то в обеих частях статьи ничего не сказано про 3D решения для видеоконференции, когда создаётся виртуальное конференционное пространство, а в качестве спикеров вещают похожие аватары, и слушатели также присутствуют в качестве аватара и могут взаимодействовать как со спикером, так и с окружающими людьми и миром. Почему 3D? Потому что это не требует дополнительных затрат на VR/AR оборудование. 

Ответить
Развернуть ветку
Видео+Конференция
Автор

Владислав, если знаете, делитесь) Есть вот такое, но оно не столько про видеосвязь, сколько про преобразование контента на местности.

Ответить
Развернуть ветку
Vladislav Orlikov

Все, что я нашел это примеры того, как это может быть организовано.
Пример 1 - https://m.facebook.com/story.php?story_fbid=2840284826067111&id=358059560956329
Пример 2 - https://www.youtube.com/watch?v=orAOe7P_Mv8&feature=youtu.be

Вроде как в Сколково занимаются разработкой 3Д движка, но результатов пока нет.
Неясно насколько это может быть востребовано в среднесрочной перспективе.

Ответить
Развернуть ветку
Видео+Конференция
Автор

Пока выглядит жутковато. 3D-контент, документы, проектирование не вызывают такого отторжения, как аватары, наверняка они пойдут впереди с точки зрения востребованности. 

Ответить
Развернуть ветку
1 комментарий
Раскрывать всегда