18 примеров, как можно использовать нейросети в мессенджере

Показываем, как прямо сейчас нейросети меняют общение в мессенджерах и предлагают новые способы взаимодействия с людьми и данными.

Привет! Это команда Линк Чаты. Мы разрабатываем корпоративный мессенджер для больших и малых команд. В будущем планируем внедрить в него нейросети, чтобы помогать пользователям работать эффективно. Сейчас находимся на стадии концепта, поэтому активно исследуем тему.

Мы изучили опыт коллег из Slack, Discord, MS Teams и Cisco. Их решения оказались интересными, неожиданными, а где-то даже немного странными. Так родилась идея зафиксировать исторический этап в развитии технологий: как нейросети уже работают в мессенджерах и на что они способны.

Статья будет полезна в первую очередь тем, кто разрабатывает или влияет на разработку сервисов и думает, как можно вписать нейросеть в текущие функции. Пользователям тоже рекомендуем ознакомиться: эти функции рано или поздно начнут появляться в массовых мессенджерах и соцсетях и наверняка станут повседневностью.

Нейросети для общения в чатах

Алгоритмы, которые помогают читать пропущенные сообщения, редактировать текст и модерировать чаты.

Резюмирование непрочитанных сообщений

Уровень пользы: 🤖🤖🤖

Где будет реализовано: Slack и Discord

Когда заходишь в чат и видишь +100 непрочитанных сообщений, у вас два варианта: быстро пробежаться по списку, не вникая в суть, или начать читать всё по порядку. Нейросеть же предлагает третье решение — получить краткую выжимку по всем непрочитанным сообщениям. Нейросеть сама решает, что важно, а что нет. Но стоит помнить, что реален сценарий, в котором выжимка не даст полной картины по пропущенным сообщениям и в любом случае придется пролистать чат и удостовериться, что вы точно не упустили что-то важное.

Редактура сообщений в переписках и документах

Уровень пользы: 🤖🤖

Где будет реализовано: Slack

Нейросеть может сократить сообщение или расширить его, исправить ошибки и перевести текст или аудио на другой язык. По сути, это классическая модель ChatGPT, встроенная прямо внутрь чата.

Еще одна интересная опция: алгоритм может поменять тональность, обучившись на сообщениях в чатах. Представляем, что она сделает, если вы с коллегами очень часто ругались или обсуждали эпизоды «Кремниевой долины».

Сгенерированные варианты ответов на сообщения коллег

Уровень пользы: 🤖

Где работает: MS Teams

Нейросеть предлагает автоответы на стандартные вопросы исходя из контекста беседы и истории переписки. Не нужно больше «окать» вручную — можно ответить заготовкой. Очень простая функция, которая чуть-чуть упрощает взаимодействие с командой, но ее точно будут часто использовать.

Модерация чатов

Уровень пользы: 🤖🤖🤖

Где реализовано: Discord

Нейросеть отлавливает спам, оскорбления и вообще всё, чему не место в рабочих и любых групповых чатах. Если раньше для этого нужно было вести черный список и штат модераторов, то теперь достаточно взаимодействовать с нейросетью. Нейросеть может улавливать смысл слов и считывать завуалированные оскорбления, то есть не просто помечать подозрительные сообщения, а еще и объяснять, почему они вызывают у нейросети вопросы.

Качество обработки зависит от уровня влияния и базы для обучения: хорошо, если алгоритм не будет распознавать как спам фамилии людей или блокировать непривычно выстроенные фразы, принимая всё, что не укладывается в ее понятия позитивного общения, за оскорбления.

Нейросети для проведения видеовстреч

Алгоритмы, которые помогают организовать звонки и сделать общение более эффективным.

Выжимка разговора после встречи

Уровень пользы: 🤖🤖🤖

Где реализовано: MS Teams, Webex

Нейросеть анализирует весь диалог на встрече, переводит его в текст, а затем составляет краткую выжимку с основными тезисами. Кроме этого, она предоставит полную стенограмму с темами, которые обсуждались на встрече с упоминаниями участников. Сама видеозапись встречи будет разбита на тайм-коды с подписями — можно будет перейти к интересующим моментам.

Отличная функция, которая станет классным инструментом по быстрой переупаковке контента — с ней будет проще находить темы прошедших бесед и копировать текст для статей и отчетов. Мы уже реализовали такую возможность в сервисе Встречи.

Спикер-коуч

Уровень пользы: 🤖

Где работает: MS Teams

После завершения звонка спикер-коуч проанализирует ваше выступление и даст стенограмму с анализом: что говорили и как быстро. Функция, которая может помочь в прокачке навыков выступления — вы можете посмотреть, например, как часто использовали слова-паразиты или тянули гласные.

Субтитры с автопереводом во время звонка

Уровень пользы: 🤖🤖🤖

Где реализовано: MS Teams

В режиме реального времени переводит речь коллеги по звонку. Отличное решение для мультиязычных команд. Думаем, первое время из-за акцента, сленга и в целом разнообразной речи автопереводчик может выдавать перлы.

Обнаружение жестов

Уровень пользы: 🤖

Где будет реализовано: Webex

Нейросеть умеет фиксировать жесты, переводить их в эмодзи и закреплять на экране. Классная фишка для вебинаров: «а теперь давайте все вместе покажем сердце» — и полетели спецэффекты на весь экран.

В остальном не самая полезная вещь. Особенно в тех компаниях, где руководство и топ-менеджмент сдержаны в проявлении эмоций. Будет забавно, если у гендиректора считается жест «благодарю», хотя он всего лишь поправил галстук 😃

Автопауза спикера во время встречи

Уровень пользы: 🤖🤖🤖

Где реализовано: Webex

Функция проста, но это именно та вещь, которой всегда не хватало 😀 Больше не нужно выключать камеру и звук, если вам нужно отлучиться от встречи: нейросеть заметит, что вы покинули место встречи, автоматически заблюрит изображение и выключит звук.

Полезно будет не во всех сценариях: если в кадре появится собака, ребенок или коллега, то звук включится снова. Но если у вас отдельная комната или кабинет, то пользоваться будет действительно удобно.

Режим «вместе»

Уровень пользы: 🤖

Где реализовано: MS Teams

ИИ вырезает фоны участников встречи и помещает их на двумерную подложку с креслами. Не знаю, насколько это помогает создать «чувство локтя», но, возможно, смысл в такой штуке есть: когда все общаются в одной рамке (а не десятке квадратиков), проще поддерживать тот самый командный дух. Но со стороны выглядит немного кринжово 🤨 Еще деталь: если человек активно жестикулирует, задевает ли он руками других людей и как происходит перекрытие?

Технологии улучшения качества видео

Уровень пользы: 🤖 🤖 🤖

Где работает: Webex

Нейросети могут не только менять фон, но и улучшать качество видео, поднимая его фремрейт. Даже если собеседник будет вещать с телефона из сетей 3G, вполне реально добиться качества 720p или даже выше. Учитывая, что связь часто бывает нестабильной, нейросети реально могут помочь сделать общение без бесящих прерываний и пропадания звука.

Нейросети настроят цвет, свет и изменят фокусное расстояние в программном режиме, не обращаясь к железу

Нейросети для организации работы

Алгоритмы, которые упрощают выполнение задач и снижают уровень рутины в процессах.

Голосовой ассистент

Уровень пользы: 🤖🤖

Где работает: MS Teams

Работает как стандартный голосовой ассистент, только с упором на рабочие задачи. Его можно спросить, что с расписанием на сегодня, попросить добавить заметку в список задач, написать сообщение в чат, совершить звонок, расшарить файл. Удобная функция для тех, кто за рулем, на пробежке или просто хочет минимизировать взаимодействие с клавиатурой.

Лично для нас — бесполезная функция. Чтобы внедрить ассистента, его нужно сначала сделать (у Microsoft есть готовая Кортана, которая и попала в MS Teams). Затем — адаптировать интерфейс и дать доступы к функциям на уровне пользователя.

Собеседник

Уровень пользы: 🤖

Где реализовано: Discord

Работает как ChatGPT: можно поговорить на любую тему лично либо вызвать бота-собеседника в общем чате. И вот здесь сценарий использования уже интересней: например, обсуждаете контент-план, вызываете бота и он накидывает идеи для постов.

Аватар-ремикс

Уровень пользы: 🤖

Где реализовано: Discord

C помощью запросов меняем аватарки людей. Бесполезно, но весело.

Доска для рисования

Уровень пользы: 🤖

Где будет реализовано: Discord

Преобразует текст и наброски в изображения. Пригодится для совместных мозговых штурмов, презентации, обучения, но вряд ли как полноценная замена Miro.

Обработка внешних данных

Уровень пользы: 🤖 🤖 🤖

Где реализовано: Slack, MS Teams

Slack даст возможность юзать ИИ в Workflow Builder, чтобы пользователи могли создавать своих ботов в зерокодинге. Сценарий может быть такой: у вас есть CRM, в ней приходит лид. Вы используйте свою нейросеть так, чтобы у менеджеров этот лид автоматически появлялся в чате со всей историей переписок или прошлых заказов.

AI Builder от Microsoft может выгружать данные из сервисов MSN и использовать их в корпоративном мессенджере.

Например:

  • распознавать текст в PDF-файлах, чтобы вы могли вытягивать данные из документов и отчетов;
  • анализировать настроения на почте — сколько нейтральных, негативных или положительных писем получали техподдержка, отдел продаж или маркетинг;
  • обрабатывать квитанции — вносить в них адреса, даты, подписи, не покидая мессенджера.

Проблемы, которые возникают при использовании нейросетей в мессенджерах (и не только там)

Нейросети прямо сейчас берут на себя функции, которые раньше людям приходилось делать вручную — они составляют фоллоу-ап после звонка, редактируют сообщения, переносят данные из таблиц в чат и обратно. Алгоритмы прямо влияют на качество видеозвонков — не только меняют фоны, но и улучшают битрейт, освещение, цвет в кадре. Пока что их роль ограничена, но даже эти возможности меняют опыт общения в сети.

При этом есть ряд проблем, которые возникают во время их использования.

Возможна предвзятость. Нейросети могут считывать и воспроизводить предвзятость. Например, был случай, когда нейросети в банках с большей вероятностью отказывали в ипотечных кредитах цветным людям, чем белым с аналогичным финансовым положением. Поэтому Cisco для платформы Webex не просто презентовал алгоритм, но и сделал особый упор на «ответственном ИИ», который будет давать каждому коллеге место за столом переговоров и возможность использовать все инструменты сервиса. Тут, видимо, имеется в виду, что нейросеть будет корректно считывать действия людей независимо от их оттенка кожи или пола.

Нужно учитывать парадокс автоматизации. Этическая проблема. Парадокс звучит так: чем лучше автоматические системы, тем менее опытны операторы. Мы редко запоминаем номера телефонов, не всегда способны быстро написать текст от руки и можем плохо ориентироваться в городе без карты в телефоне.

Иногда парадокс автоматизации вытекает в излишнее доверие к алгоритмам. Нередки случаи, когда водители автомобилей слепо следовали по предложенному маршруту GPS-навигатора и оказывались в местах, где автомобиль не может проехать.

Водитель ехал по GPS-навигатору, игнорируя все указатели на дороге. В итоге оказался на пешеходной тропе и застрял между скал (Источник: Motor.ru)

Нейросети, которые пишут сообщения, переводят речь коллег с одного языка на другой и придумывают концепции — снижают наши экспертные навыки, потому что алгоритмы лишают возможности практиковаться нас. Если сейчас это не проблема, то через несколько лет активного использования нейросетей мы можем оказаться теми самыми водителям, которые слишком сильно доверяют системам и забредают совсем не туда, куда хотели.

Проблема «черного ящика» — непонятно, как нейросети решают задачи. Часто невозможно (или очень сложно) проанализировать и понять, как нейросеть приняла то или иное решение.

Так было, например, с DALL-E: на некоторых изображениях нейросеть стала использовать придуманный язык, который невозможно было понять. Ученые смогли задать нейросети вопросы и выяснили, что слова обозначают различные предметы и явления, но до конца расшифровать их нельзя.

Язык удалось расшифровать, только попросив отыскать изображения по использованным словам (Источник: N+1)

В итоге мы видим только конечное решение, без возможности рассмотреть его по шагам или отмотать на пару шагов назад. Так, в мессенджерах нейросеть сможет отредактировать текст, но вы не сможете точно понять, как она это сделала и какими правилами руководствовалась. В тексте ошибки мы найдем, а что если нейросеть сделает стратегию, расчет и анализ данных, а мы даже не сможем понять, как она их посчитала и на что вообще ориентировалась?

Как проблемы нейросетей обходят разработчики. Пока что внедрение нейросетей — это история про новые инструменты, которые помогают автоматизировать работу или избавить нас от рутинных задач:

  • нейросеть не напишет за вас ответ коллеге, но может предложить варианты;
  • нейросеть не сделает отчет, но поможет собрать данные или передать их в таблицу;
  • нейросеть не пойдет на встречу за вас, но зато сможет перевести общение в текст и прислать краткую выжимку.

Титры

Нейросети — это не только модная технология, но и отличный способ расширить функционал сервисов. Думаем, что компаниям и сервисам еще предстоит открыть все возможности нейросетей в пользовательских сценариях. Но даже сейчас, когда их используют по чуть-чуть, можно увидеть, как они меняют привычные коммуникации.

Расскажите в комментариях, какие функции вам кажутся наиболее важными, а какие нет. Учтем при внедрении нейросетей в Линк Чаты. Если хотите еще как-то повлиять на разработку, то подписывайтесь на наш телеграм-канал, участвуйте в опросах и делитесь идеями.

0
9 комментариев
Написать комментарий...
Вадим Д.

Класс! Благодарю за хороший материал 👍🏻

Ответить
Развернуть ветку
Айдар Каримов

Выжимка сообщений по выбору нейросети такое себе. Лучше по старинке по темам пробежать

Ответить
Развернуть ветку
МТС Линк
Автор

Думаем, выжимка будет работать скорее как оглавление по обсуждению в чате, чтобы можно было быстро погрузиться в контекст. Но как будет на практике, конечно, ещё не понятно 🙂

Ответить
Развернуть ветку
Кирилл Родин

Хорошая статья, спасибо)

Ответить
Развернуть ветку
Denis Konnov

Автоматическое саммари встреч топ. Поскорее бы на русском заработало)

Ответить
Развернуть ветку
МТС Линк
Автор

Пока что остаётся вести стенограмму вручную и делать фоллоу ап самостоятельно. Навык тоже полезный 😉

Ответить
Развернуть ветку
Вячелав Садилов

Какая же многофункциональная нейросеть

Ответить
Развернуть ветку
МТС Линк
Автор

Кажется, это ещё не всё сценарии – алгоритмы в нейросетях постоянно развиваются. Например, вполне реально, что они смогут в режиме реального времени генерировать видеопоток и вписывать людей на звонках в любую обстановку.

Ответить
Развернуть ветку
AlSh

Вы немного не понимаете, что такое нейросеть. У нейросетей как таковых "алгоритмов" не так чтобы много. В общем случае нейросейти решают некое гигантское уравнение - если выражаться упрощенно.

К чему я это говорю? Сейчас журналисты хайпуют, взяв любой продукт, где прилепили лейбл "AI". Сеть там может выполнять несколько процентов от общего объема задач. Но при этом нейросетью называют продукт целиком - что в корне неверно и с точки зрения объективности даже является фальсификацией самого низкого пошиба.

Автоматически вырезать человека из общей картинки и подкладываать на другой фон умели и раньше. Просто правильно натренированная сеть произведет сегментацию аккуратнее, а другая - впишет объект более-менее правдоподобно в подложенный фон, учтя особенности освещения. При этом сами эти модели ничего не смогут в отрыве от большого количества традиционных вычислительных алгоритмов.

Ответить
Развернуть ветку
6 комментариев
Раскрывать всегда