{"id":14271,"url":"\/distributions\/14271\/click?bit=1&hash=51917511656265921c5b13ff3eb9d4e048e0aaeb67fc3977400bb43652cdbd32","title":"\u0420\u0435\u0434\u0430\u043a\u0442\u043e\u0440 \u043d\u0430\u0442\u0438\u0432\u043e\u043a \u0438 \u0441\u043f\u0435\u0446\u043f\u0440\u043e\u0435\u043a\u0442\u043e\u0432 \u0432 vc.ru \u2014 \u043d\u0430\u0439\u0434\u0438\u0441\u044c!","buttonText":"","imageUuid":""}

Автоматизированное распознавание и документирование речи в конференц системе

Технологии идут вперёд, способствуя повышение качества жизни людей и избавлению от рутинной работы. Работа с документами, их учётом, заполнением стандартных форм, стенография и т.д. всегда была одной из самых нелюбимых и скучных. В связи с этим, набирают популярность различные цифровые приложения, позволяющие автоматизировать эти задачи, начиная от голосового набора в смартфоне, заканчивая профессиональными приложениями. Об интеграции данных профессиональных приложений мы и хотели бы рассказать.

Вариантов систем документирования речи сейчас достаточно много, из крупных иностранных производителей это:

  • Системы Google, в частности G Suite или Google Cloud Speech API;
  • Серия программных продуктов Dragon от компании NUANCE;
  • Решение Braina Pro от компании Brainasoft

Из российских разработчиков можно выделить:

  • Системы распознавания Нестор, разработчик – ООО «Центр речевых технологий»;
  • Система IS Mechanics SRS Femida, разработчик - ЗАО «Фирма Инфорсер»

В данном случае нам удалось посотрудничать с коллегами из компании Центр речевых технологий – SpeechPro по моделированию аппаратной инфраструктуры конференц решений для системы Нестор.

Ключевой особенностью, и наверное одним из важных преимуществ с технической точки зрения, является то, что система Нестор работает с цифровыми аудиопотоками, использующими протокол передачи аудиоданных Dante (разработчик Audinate, Австралия).

Цифровизация аудио – важнейший тренд на сегодня, и производители, которые сейчас не слишком сфокусированы на этом, могут сильно просесть на рынке решений в будущем. Также стоит сказать, что выбор именно Dante является очень грамотным решением, так как данный протокол имеет большую популярность в мире аудио, такие компании как Yamaha, EXTRON, Crestron, AMX, Shure, DiGiCo, SSL, Allen & Heath и многие другие, повсеместно интегрируют его в своём оборудовании, работа с Dante позволяет создать более универсальное и гибкое решение, которое не будет нуждаться в приобретении дополнительных лицензий на проприетарные протоколы передачи данных, и позволит использовать достаточно широкий перечень оборудования в своих решениях.

Однако, мир конференц систем, активно и полнофункционально поддерживающих Dante, ограничивается в основном решениями компании Shure. Безусловно, есть различные дополнительные интерфейсы, позволяющие системам от Bosch или Televic работать в сетях Dante, но полностью интегрированным являются только системы Shure.

На основании этого и был сделан выбор в пользу оборудования Shure для проектирования конференц системы.

В первой итерации проектирование было проведено на базе проводной конференц системы Shure – DDS 5900 / Microflex Complete.

​Оборудование конференц системы Shure DDS 5900

Выбор проводной системы часто обусловлен сложными радиочастотными условиями на объектах заказчиков, потому на наш взгляд, такие системы являются скорее вынужденной альтернативой перед беспроводными системами.

Базовый состав оборудования для DDS 5900 следующий:

  • Центральный блок управления DIS-CCU-E – 1 шт.;
  • Конференц пульты различных вариаций, в самой простой модели MXC615 до 250 пультов на 1 блок управления;
  • Микрофоны для конференц пультов, MXC416 / 420.

В рамках интеграции программы Нестор необходимо было реализовать возможность получения отдельного Dante канала для каждого пульта конференц системы.

Как это сделать?

Центральный блок DIS-CCU имеет 8 аналоговых аудиовыходов, соответственно для использования Dante необходимо преобразовать эти аудиопотоки в цифру. Для своих проводных аналоговых систем компания Shure предлагает 3 вида сетевых аудиоинтерфейсов с поддержкой Dante – Shure ANI22 (конвертирует 2 аналоговых сигнала в сигнал сети Dante, и цифровой сигнал Dante в 2 аналоговых сигнала), ANI4IN (конвертирует 4 аналоговых сигнала в сигнал сети Dante), ANI4OUT (конвертирует сигнал сети Dante в 4 аналоговых сигнала).

Однако, чтобы получить отдельный Dante сигнал с каждого конференц пульта, необходимо каждый отдельный аналоговый выход идентифицировать с цифровым потоком Dante.

Для этого была предложена следующая схема:

К центральному блоку управления DIS-CCU добавляются 2 сетевых интерфейса ANI4IN. Соответственно имеем 2 выходных Dante потока, каждый из которых содержит 4 аудиомикса.

Таким образом, мы имеем возможность ввести в сеть, и соответственно потом получить на входе программного комплекса Нестор - 8 отдельных цифровых аудиоканалов.

Но возникает резонный вопрос, что делать, если конференц пультов больше чем 8?

В обычных условиях, на стандартной прошивке, блок управления DIS-CCU поддерживает до 250 конференц пультов, но одновременно может выдать только 8 аналоговых выходных каналов, остальные пульты будут стоять в очереди. Тоже самое касается и Dante, блок управления поддерживает только 8 выходов, а нам необходимо к каждому конференц пульту сопоставить свой Dante поток.

Единственным выходом в данной ситуации является вариант наращивания центральных блоков управления.

Таким образом у нас в системе появляется уже 2 центральных блока DIS-CCU, 4 сетевых интерфейса ANI4IN и возможность работы с 16 конференц пультами MXC615.

Такое масштабирование ограничивается в основном техническими характеристиками пропускной способности сети / маршрутизатора, а также параметрами используемой для обработки полученных сигналов Dante Virtual Soundcard, которая позволяет обработать до 64 цифровых аудиоканалов.

Dante Virtual Soundcard​ audinate.com​

Ёмкость канала передачи данных можно рассчитать исходя из частоты дискретизации сигнала, в нашем случае 48 кГц и значения разрядности 24 бит.

Итого ёмкость одного канала составит 48 кГц * 24 бит = 1,152 Мбит/с.

Стандартный поток Dante от 1 до 4 каналов имеет ёмкость примерно 6 Мбит/с.

Очевидно, задача решена, сводим все центральные блоки управления в один маршрутизатор, с него снимаем общий сигнал на Dante Virtual Soundcard и производим распознавание.

Так оно и есть для программы Нестор, но в рамках такой конфигурации, к сожалению, потеряна функциональность конференц системы. То есть функции конференции, такие как назначение председателя, составление очереди делегатов, общий Mute, отключение всех микрофонов при работающем председателе и т.д., штатно реализуемые на каждом отдельном центральном блоке DIS-CCU, не работают для всей системы вцелом.

Нельзя назвать это недостатком системы DDS 5900, скорее эта схема не подпадает под стандартную логику реализации конференц систем.

Как же всё-таки реализовать управление в рамках всей системы?

Для решения этой задачи, мы воспользовались процессором и системой управления от компании EXTRON - Процессор управления IP Link Pro IPCP PRO 350 с установленным программным обеспечением LinkLicence 79-2546-01, позволяющим воспроизводить интерфейс системы управления на любом переферийном устройстве – через Web-интерфейс, iPad, планшет под управлением Android.

​EXTRON IPCP PRO 350 extron.ru

Интеграция достаточно проста.

IPCP350 подключается через один из Ethernet выходов к общему маршрутизатору. Далее в интерфейсе настройки процессора Global Configurator Plus добавляется необходимое количество блоков управления DIS-CCU в соответствии с количеством портов процессора, в случае IPCP350 – 8 сетевых портов.

Общая схема коммутации оборудования  shureconference.ru

Драйвер позволяющий ассоциировать DIS-CCU с сетевым портом IPCP350 поставляется в общем комплекте драйверов для данного процессора. Стандартный пакет драйверов, которые можно бесплатно загрузить с сайта Extron содержит большой перечень оборудования различных производителей, и вероятность найти необходимое, достаточно высока.

​EXTRON Global Configurator Plus

После этого, у процессора появляется возможность управления каждым отдельным центральным блоком DIS-CCU в сети.

Осталось только сделать пользовательский интерфейс, который бы позволял активировать те или иные режимы конференций.

Для этого существует программное обеспечение Extron GUI Designer, в котором можно спроектировать пользовательский интерфейс как с чистого листа, так и на основе шаблонов типовых интерфейсов Extron.

​EXTRON GUI Designer

После проектирования пользовательского интерфейса, его необходимо загрузить в процессор IPCP350.

И далее запрограммировать пользовательские кнопки в соответствии с необходимыми режимами конференции.

После окончания программирования, систему управления конференции можно открыть в Web интерфейсе и начать работать.

Таким образом, данное решение может быть достаточно типовым и легко масштабируемым для конфигураций до 64 конференц пультов, с возможностью идентификации и управления каждым отдельным пультом, получения с него цифрового аудио по протоколу Dante и дальнейшего автоматического протоколирования с использованием системы Нестор.

0
Комментарии
-3 комментариев
Раскрывать всегда