ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Плюс приложение, которое поможет расшифровать записи людям с особенностями речи, выборочное шумоподавление и увеличение команды за счет ботов. Собрали главные новости за прошедший месяц.

Первый видеозвонок через спутник Starlink

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

SpaceX тестирует видеозвонки с помощью обычных никак не модифицированных Android-смартфонов через спутники Starlink с технологией Direct to Cell. Скорость соединения может достигать 17 Мбит/с.

До конца года сервис могут запустить в США для клиентов T-Mobile в отдаленных районах, куда не достают вышки сотовой связи. Конкуренты уже нажаловались в FCC, призывают комиссию заставить SpaceX прекратить испытания — подробности

Маркировка AI-контента от Google

Google показал инструмент SynthID — он маркирует специальными водяными знаками видео, аудио, изображения и текст, сгенерированные с помощью AI.

Специальные модели и алгоритмы встраивают маркировку прямо в контент, созданный искусственным интеллектом. В случае с текстом водяные знаки интегрированы непосредственно в процесс, который LLM-модель использует для генерации текста.

Постквантовое шифрование в Zoom

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Zoom внедряет по всему миру постквантовое сквозное шифрование E2EE для своих продуктов. Пока реализовано в Zoom Meetings, скоро появится в Zoom Phone и Zoom Rooms.

При определенных обстоятельствах злоумышленники могут перехватить зашифрованный сетевой трафик сейчас с намерением расшифровать его позже, когда квантовые компьютеры станут более продвинутыми — сценарий, который часто называют «собери сейчас, расшифруй позже»... Zoom занял активную позицию, обновив алгоритмы, разработанные для противостояния этим потенциальным будущим угрозам.

Постквантовое шифрование Zoom использует алгоритм Kyber 768 — механизм инкапсуляции ключей на основе модульной решётки в соответствии со стандартом FIPS 203, утвержденным Национальным институтом стандартов и технологий (NIST).

В феврале Apple добавил в iMessage постквантовый криптографический протокол PQ3. Signal использует PQXDH — постквантовый расширенный протокол Диффи-Хеллмана.

Google Meet собирает звук с ноутбуков

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Если у вас нет нормального микрофона в переговорной или он сломался, Google обнаружит все ноутбуки в комнате и предложит объединить звук со встроенных микрофонов, а также синхронизировать динамики. Искусственный интеллект уберет эхо от нескольких устройств.

Функцию назвали «адаптивное аудио», она включена по умолчанию. На боковой панели участники с объединенным звуком автоматически группируются. У пользователей есть возможность отключить опцию вручную.

Это большое преимущество для организаций, у которых недостаточно помещений для видеоконференций или нет ресурсов для закупки специального оборудования в конференц-залы.

P.S. Microsoft недавно в систему профессиональной многокамерной съемки добавил камеры личных ноутбуков, с которых могут подключаться участники в переговорной.

Расшифровка нетипичной речи для конференций

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Voiceitt обрабатывает произношение с акцентом и нарушениями различного происхождения.

Люди с особенностями речи записывают образцы — потребуется около 200 отрывков. Потом в течение нескольких часов формируется их собственный речевой профиль. Персональная модель постоянно дообучается в процессе общения. Есть поддержка команды логопедов.

Voiceitt доступен как надстройка для FaceTime, MS Teams, Webex и Zoom. Скоро обещают выпустить Chrome-расширение для работы в Google Classrooms, Google Workplaces и на других платформах через браузер.

Результат расшифровки приложение выдает в формате онлайн-субтитров непосредственно в конференцию. Есть также отдельное приложение для взаимодействия с системами умного дома, надиктовки текстов. Для настройки предлагают бесплатный период на 1 месяц.

Полноценная совместная работа в Zoom с любым контентом и инструментами

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Корпоративные надстройки для Zoom все еще актуальны — недавно вышло в свет приложение ProFeatures for Zoom. Фаундер образовательной платформы Blackboard Майкл Чейзен в 2011 году продал ее за $1,64 млрд, а позже сделал надстройку Class для Zoom, которая помогала педагогам вести занятия во время пандемии. К вопросу о том, что человек в отрасли не случайный.

От пользователей стали поступать недвусмысленные сигналы, что что-то похожее на Class пригодилось бы и для бизнеса.

Поэтому я попросил разработчиков взять наш продукт, отключить инструменты для обучения и оставить фундаментальные улучшения, которые мы внесли в Zoom

Что дает ProFeatures for Zoom:

  • совместное редактирование документов Microsoft Office и Google Docs, работа на доске Miro и над кодом в Microsoft Visual Studio — правами доступа на комментирование и редактирование можно управлять
  • если предложенных инструментов недостаточно, есть встроенный браузер, откуда можно работать с любым сайтом, приложением и контентом
  • участники могут открывать дополнительные вкладки параллельно с презентацией/экраном спикера и работать с ними по ходу встречи
  • есть умный ассистент ProFeatues AI, который расшифровывает собрание, готовит сводки и справки, при этом использует в своих ответах все доступные для работы документы и веб-контент, которым делились участники

Итого у разработчика есть две образовательные надстройки Class для Zoom и Microsoft Teams + бизнес-приложение ProFeatures for Zoom.

Еще до официального старта ProFeatures было продано корпоративных лицензий на $17 млн.

В одиночку его можно использовать бесплатно, но все преимущества становятся очевидными только в командной работе.

Аврал? Google и Microsoft нагенерируют вам виртуальных сотрудников

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Google на базе AI Gemini предлагает создавать виртуальных коллег-ботов. Им выдают собственный профиль, имя, роль в команде и запускают в рабочие чаты.

Инструмент называется AI Teammate. Виртуальный участник виден всем, отвечает на вопросы исходя из доступного контекста, может делать сводки, готовить материалы и выполнять разные задачи. Ничего никогда не забудет и не пропустит.

Microsoft тоже сдает в аренду виртуальных сотрудников. В предварительной общедоступной версии Copilot Studio уже в этом году появится возможность создавать помощников с расширенным функционалом. Они кроме поговорить смогут брать на себя многоступенчатые несложные задачи, мониторить почту, вводить данные, отслеживать ход заявки. С точки зрения процессов это может быть техподдержка, адаптация новых сотрудников, работа с клиентами.

От сбоев и галлюцинаций будут защищать элементы управления: виртуальный сотрудник должен действовать в рамках инструкций по автоматизации задач. Активироваться такой агент сможет разными событиями, а не только сообщениями человека в чате.

Фокус AI смещается с поиска и обобщения информации на автоматизацию рутины, с индивидуальной переписки — на взаимодействие с группой людей. Новую функцию Team Copilot покажут позже в этом году. Помощник сможет модерировать командные чаты, назначать задачи, отслеживать сроки и повестку встреч.

Показали работающий прототип системы выборочного шумоподавления

Исследователи из Вашингтонского университета, про которых мы писали осенью, показали работающий прототип своих наушников с выборочным шумоподавлением. Новый алгоритм распознаëт и отсекает ненужные шумы, при этом никак не затрагивает и не изменяет нужные нам звуки, независимо от их частот. Распространенные же сейчас системы заглушают «шумные» частоты и вместе с ними искажают потенциально интересные для нас сигналы.

Теперь нажатием кнопки можно находить голос конкретного человека и слушать только его, исключив все остальные шумы. Система обучена различать 20 типов звуков, включая будильники, плач младенцев и пение птиц. Каждую категорию можно заблокировать.

Обработка происходит локально, очищенное аудио поступает обратно с задержкой менее 8 миллисекунд. Команда считает, что технология уже может быть реализована на аудиоустройствах и готова к коммерциализации.

BYOAI — Принеси свой искусственный интеллект

ВКС-дайджест: первый видеозвонок через Starlink, постквантовое шифрование в Zoom и маркировка AI-контента

Оказывается, аж 75% работников умственного труда применяют ИИ-инструменты на работе, из них 46% начали это делать менее полугода назад.

Руководители сомневаются в немедленной отдаче и эффективности вложений. Поэтому сотрудники пользуются чем попало без разрешения и держат это в секрете.

Посторонние сервисы применяют 78% пользователей ИИ. В основном такое происходит в малых и средних компаниях — 80%.

52% людей, использующих ИИ на работе, скрывают это.

53% беспокоятся, что их перестанут считать незаменимыми, раз они применяют алгоритмы для решения ключевых рабочих задач.

Источник: Microsoft, опрос 31000 работников интеллектуального труда в 31 стране, февраль-март 2024

1111
Начать дискуссию