Так, Человек или Машина? Что говорят эксперты

«Нам не нужны машины, которые умнее нас, нам нужны машины, которые помогут нам становиться умнее».

Это цитата Константина Воронцова, профессора РАН и руководителя лаборатории машинного интеллекта при МФТИ, который недавно выступал в Москве на отраслевой конференции по теме разговорного машинного интеллекта — «Человек и Машина».

Так, Человек или Машина? Что говорят эксперты

Конференция прошла 24 октября. Мы (Лаборатория Наносемантика) организовывали мероприятие такого формата первый раз. Судя по обратной связи, участники тоже остались довольны. Мы собрали аж 136 человек!

Коротко о том, как прошло мероприятие, инсайты из выступлений спикеров, а также ссылки на их выступления и презентации в этой статье.

Для чего, собственно, мы это затеяли?

В России много разных компаний, у каждой свой подход в решении таких задач: кто-то занимается анализом структурированных данных, кто-то экспертными системами, кто-то использует нейронные сети. Речевая аналитика, классические чат-боты, голосовые роботы для обзвона — те области применения, которые сегодня интересуют бизнес. Кто-то уже внедрил у себя чат-бота, кто-то сомневается — а так ли эта технология эффективна и стоит ли затраченных усилий.

Мы пригласили спикеров поделиться своим опытом и наблюдениями, без лишней воды и маркетинга, и вот что из этого получилось (далее вкратце "пройдемся" по спикерам).

Анна Серебряникова и Сергей Переверзев из компании «МегаФон» рассказали, как они сделали проект для помощи юристам — Nlogic. У системы удобный, простой, кастомизируемый интерфейс. Nlogic способна создавать договора, распознавать юридические документы, автоматически составлять отзывы на потребительские иски, распознавать ключевые термины и т.д. Однако спикеры отметили, что в юридической сфере наблюдается большое недоверие технологиям искусственного интеллекта.

[В юр. сфере] пока никто не пытался создавать что-то подобное, никто не создавал датасеты. По большому счету у нас получился интересный результат, который стоит исследовать глубже, т.к. право, будучи также алгоритмом, начинает проявляться в этих, казалось бы, хаотичных действиях.

Сергей Переверзев, генеральный директор Nlogic, директор по правовым вопросам «МегаФон»

Анна отметила, что вся бэкофисная функция – это какой-либо алгоритм (бухгалтерия, финансы, право). Поэтому, задача распознать и понять машиной текст, а потом превратить его в ответ или призыв к действию – это задача, которая масштабируется на любой процесс.

Сейчас тема legal tech находится в ранней стадии развития. Все понимают, что в сферу права нужно внедрять искусственный интеллект, но это сложно в силу консервативности и кастовости продавать такие продукты.

Анна Серебряникова, член совета директоров «МегаФон», сооснователь Nlogic

Бизнес может подумать: «Зачем тратить деньги на какой-то продукт, если юрист стоит недорого?» Но бизнес забывает, что машиной и системами легче управлять. Когда у вас большой массив данных (по оценке Константина Воронцова, количество приказов в «МегаФоне» сравнимо по объему с законодательством РФ), им сложно управлять вручную. Поэтому в таких крупных компаниях, как «Мегафон», движутся к тому, чтобы автоматизировать эти процессы и обеспечить исполнение договорённостей между сторонами в гражданских правоотношениях, но никак не заменить юристов.

Видео выступления спикеров (к сожалению, из-за технических неполадок, кроме доклада Константина Воронцова) здесь.

Игорь Пивоваров, главный аналитик Центра по искусственному интеллекту НТИ на базе МФТИ, поделился ключевыми положениями исследования рынка NLP в России, которое было выпущено Центром компетенций НТИ на базе МФТИ в виде аналитического сборника № 2 «Альманах искусственный интеллект: обработка естественного языка, распознавание и синтез речи».

Анализ отрасли привёл к выводу, что сейчас машинам всё еще трудно воспринимать естественную речь. Им недостаточно понимать смысл отдельных слов — необходимо построение языковых моделей и механизмов внимания, которые помогают ИИ определить вероятность следующего слова в предложении и улучшить качество ответов на запросы пользователей. Подводя жирную черту можно сказать, что естественный разговор с роботом остаётся пока далёкой перспективой. Машинам необходимо более глубокое понимание различных логических связей, человеческой эмпатии и поведения собеседника.

Видео выступления Игоря Пивоварова здесь.

Игорь Баско, исполнительный директор компании «Фонемика», рассказал о решениях, которые используются на рынках США и Китая и поделился опытом выхода на эти рынки.

Многим российским компаниям кажется, что эта задача почти не решаемая. Даже если технология «классная», российские компании «не всегда могут сделать продукт, чтобы бизнес услышал и начал им пользоваться».

Игорь привел оценку издания Forbes, по которой рынок «customer experience» — «один из самых ёмких на планете». По его наблюдениям, американский рынок практически перешел на все процессы связанные с режимом реального времени (real-time) — не только в обработке речи, но и документов, платежей и многих других запросов. Из трендов спикер выделил следующие:

​Слайд из презентации спикера.
​Слайд из презентации спикера.

Видео выступления Игоря Баско здесь.

Виктор Сафронов, CEO Aithea и сооснователь Лаборатории машинного интеллекта при МФТИ, выступил с прикладным докладом про автоматизацию клиентской поддержки в ритейле на примере чат-ботов Вкусвилл и для лидера американского фастфуда (название компании спикер не раскрыл).

Зачастую заказчик [ритейлер] ставит перед собой задачу удержать клиента. Продуктовый ритейл – это бизнес, в котором клиент должен возвращаться. Если он уходит по какой-то причине, то это потеря наработанной базы – базы, которую, очень сложно восполнить. Поэтому задача увеличивать retention, поддерживать его на должном уровне, достаточно критична.

Виктор Сафронов, CEO Aithea, сооснователь Лаборатории машинного интеллекта при МФТИ

«Ни один бизнес никогда не будет держать столько людей, чтобы постоянно в онлайне отрабатывать каждое обращение с нулевой задержкой. Это не рентабельно, потому что есть волны активности входящих обращений (в основном люди пишут или звонят днём), и даже если вдвое увеличить штат операторов, большую часть времени они будут сидеть без дела».

Видео выступления Виктора Сафронова здесь.

Алексей Перевозчиков, Regional Manager Eurasia в компании Infobip (вендор WhatsApp (WA) Business API в России, имеют уже около 45 запущенных кейсов), считает, что с WA необходимо работать каждому бизнесу: «WA позволяет находить новых клиентов, а не только коммуницировать с текущими».

Сегодня WA предлагает для бизнеса три продукта: сам мессенджер, Business App (решение для малого бизнеса) и WA Business API (для среднего и крупного бизнеса, с возможностью внедрения чат-ботов и статусом официальной страницы компании).

Видео выступления Алексея Перевозчикова здесь.

Арсений Назаркин, генеральный директор компании Kvint, рассказал о неудачных кейсах: первый — когда из синтеза голоса было очевидно, что говорит робот, и люди не хотели с ним разговаривать, и второй, когда робот нагонял скуку и дискомфорт из-за слишком длинных фраз. В обоих случаях участие робота сильно снижало конверсию.

В сфере голосовых роботов очень важно сделать голос бота максимально естественным, т.к. люди обычно недовольны, когда понимают, что разговаривают не с человеком... Скрипт [бота] не должен быть слишком простым, нужно уделять много внимания на его составление, составлять комплексные ветви диалога, не удлинять фразы, т.д.

Арсений Назаркин, генеральный директор компании Kvint

Видео выступление Арсения Назаркина здесь.

Антон Бондаренко, менеджер продукта в «Тинькофф Банке», рассказывал об умном помощнике Олеге: чем он живет, чем отличается от конкурентов и как его планируют развивать дальше.

Олег – это не только чат-бот в приложении, но и помощник в повседневной жизни, советник по финансам и экономии денег.

В компании долго спорили, должен ли Олег разговаривать на свободные темы. После многих тестов, решили оставить эту функцию, несмотря на риски. Распространился [Олег] достаточно быстро, т.к. всем были интересны его ответы.

Антон Бондаренко, менеджер продукта в «Тинькофф Банке»

Самый популярный сценарий диалога с Олегом – переводы денег и мониторинг подписок. Ценность у разных сценариев определяется по-разному. Если сценарий связан с проблемой пользователя с продуктами Тинькофф (и он не был отвечен Олегом, а перешёл к оператору) – ценность здесь в экономии на колл-центре. Если это сценарии, несущие добавленную стоимость (они могут продавать что-то пользователю или не продавать) – ценность состоит или в прямой продаже в первом случае, или влиянии на метрики во втором.

Видео выступления Антона Бондаренко здесь.

Станислав Ашманов, руководитель компаний «Лаборатория Наносемантика» и «Нейросети Ашманова», выступил с докладом про open source в мире голосовых ассистентов.

Станислав считает, что минус многих open source платформ для разговорного ИИ в том, что они «игнорируют голос, развивают только текстовые каналы, не представляют рабочих инструментов (конструкторов, GUI) и созданы программистами для программистов».

Open source – это единственный способ выйти на международный рынок и эффективный способ стать отраслевым стандартом.

Станислав Ашманов, CEO «Лаборатория Наносемантика» и «Нейросети Ашманова»

К вопросу о конкуренции (например, с Амазоном, которые активно интегрируется везде) Станислав отметил, что в том же Амазоне все «сильно завязано на серверах корпораций»: то есть нельзя локально установить Алексу в своем автомобиле. По его мнению, выиграть можно путем разработки приватного решения, которое будет оставлять право на раскрытие персональных данных за пользователем и давать свободу разработчикам в использовании решения.

Видео выступления Станислава Ашманова здесь.

Все презентации спикеров можете скачать на сайте конференции. А мы пока пошли готовиться к следующей ;)

22
3 комментария

"Нам не нужны машины, которые умнее нас". Вам и люди не нужны которые умнее вас. Фашисты!

Кто же вас так обидел, Эрик? Откуда столько агрессии?