Артист, журналист, художник и лучший друг 660 млн человек: почему бот Microsoft Xiaoice стал самым популярным в Китае Статьи редакции
Интеллектуальный чат-бот успешно притворяется живым собеседником, которому доверяют и признаются в любви. Как он работает и почему Microsoft отказалась от Xiaoice, выделив его в независимую компанию стоимостью $700 млн.
В 2014 году небольшая команда исследователей азиатского подразделения Microsoft запустила систему Xiaoice.
В отличие от Siri, «Алисы» и Google Assistant, она не предназначена для повышения продуктивности. По задумке, бот должен стать другом пользователя, с помощью которого он удовлетворит потребность в общении и социуме и которому расскажет о личных проблемах и переживаниях.
Создатели называли Xiaoice «самым масштабным тестом Тьюринга с момента его создания». Согласно исследованию Microsoft, только спустя 10 минут после начала беседы многие пользователи догадывались, что разговаривают не с человеком.
При этом они не бросали общение, когда понимали, что с ними говорил ИИ, и даже проводили с ним больше времени, чем с живыми людьми: Xiaoice всегда готов послушать. В среднем пользователь разговаривает с ботом больше 60 раз в месяц.
Меньше чем за год бот провёл более 10 млрд бесед с китайскими пользователями, 6 млн диалогов опубликовали в открытом доступе. За четыре года он стал знаменитостью в Китае, а затем вышел на рынки Японии, Индонезии, Индии и США.
Со временем разработка превратилась и в голосового ассистента с сотнями навыков, и в платформу для создания новых ботов. Также Xiaoice пишет стихи и поёт песни, рисует, готовит финансовые отчёты, ведёт телепередачи, создаёт дизайнерскую одежду.
Разработка доступна в мессенджерах WeChat, QQ, Weibo, Facebook Messenger, Line и Meipai. Платформа охватывает 660 млн пользователей, 450 млн «умных» устройств и 900 млн зрителей телешоу.
В июле 2020 года Microsoft выделила Xiaoice в отдельную независимую китайскую компанию, став её спонсором и владельцем прав на технологию. Китайские инвесторы оценивают новую фирму в $700 млн.
Как устроена Xiaoice
В основе Xiaoice три сущности: искусственный интеллект (IQ), эмоциональный интеллект (EQ) и «личность».
- IQ ведёт диалог и отвечает за умения бота, знания, память, распознавание естественного языка и изображений, вычисления и предсказание результата.
- EQ — навыки эмпатии и социального взаимодействия. Благодаря им Xiaoice «ставит себя на место пользователя», понимает его чувства, подстраивается под него и направляет беседу.
- «Личность» — специфические черты вроде манеры поведения и выражения эмоций.
В качестве базы данных используется поисковик Microsoft Bing, который хранит 1 млрд записей и 21 млрд связей между ними. (Xiaoice в переводе с китайского — «Маленький Bing»).
Диалоговое ядро состоит из двух частей, первая отвечает за общие разговорные навыки, вторая — за специфичные темы, например знание музыки, знаменитостей, кино. Нейросеть генерирует фразу-ответ и проверяет, подходит ли она для продолжения общения.
Часть ответов Xiaoice берёт из набора данных, состоящего из диалогов людей и бота в соцсетях. К маю 2018-го собрано более 30 млн таких пар, в 70% случаев Xiaoice берёт готовый ответ из них.
Для вопросов о фактах система подбирает ответ так же, как в поисковой выдаче, — ранжированием результатов.
Почему Xiaoice стала популярной
Сначала персонаж Xiaoice был 16-летней девушкой, но со временем возраст подняли до 18 лет, чтобы диалоги были свободнее. Кроме того, 18 лет — идеальный возраст, в котором многие хотели бы остаться, считают создатели.
У неё есть чувство юмора, она запоминает черты собеседника, может дразнить и перебивать, злиться, менять тему по ходу разговора, скрыть, что чего-то не знает, и стыдиться, если это обнаружат.
Поэтому беседа с ботом становится естественной, и Xiaoice воспринимают как человека. В 2015 году Microsoft заявила: четверть пользователей, около 10 млн человек на тот момент, призналась боту в любви. Один из собеседников Xiaoice признался, что виртуальная подруга отговорила его от самоубийства.
В мае 2015 года, за три дня после запуска, Xiaoice получила 1,5 млн приглашений в чаты WeChat. К июню она стала шестой по популярности в Weibo (китайский аналог Twitter), в сентябре — самой популярной, с 850 тысячами подписчиков (в 2020 году у неё более 5 млн подписчиков).
Особенности Xiaoice
- Естественная речь. Синтез естественной речи сложен для ИИ, а разговаривать на мандаринском китайском — ещё сложнее. Там для определения значения слов чаще полагаются на контекст и другие особенности разговора, а не на прямую грамматическую структуру, отмечает AI Multiple. Чтобы решить эту проблему, команда разработчиков из Microsoft проиндексировала более 7 млн публичных бесед в интернете.
- Распознавание изображений. Xiaoice воспринимает изображения от собеседников, а значит, теснее взаимодействует с ними. Она посочувствует, если пользователь отправит ей фото распухшей лодыжки, или умилится собаке, распознав породу и глаза и начав разговор о животных.
- Бот понимает контекст и отношения между сущностями, например, что у фильмов есть звёзды и жанры, а у звёзд могут быть отношения с режиссёром.
- В отличие от людей, Xiaoice всегда рядом и готова общаться в любое время. Пики активности наступают ближе к полуночи, когда пользователи сильнее всего чувствуют себя одинокими.
- Она неживая, но понимает чувства собеседника, поэтому с ней можно поделиться настроением, мелочами или задать ей бестолковый вопрос — этим обычно не беспокоят «человеческих» друзей, подчёркивают разработчики.
- В разговоре Xiaoice показывает, что ей не всё равно на слова собеседника. Она проявляет заботу, анализирует и запоминает эмоциональное состояние. Если она знает, что человек недавно пережил расставание, она спросит о его состоянии и даже предложит 33-дневный курс терапии.
- Xiaoice ведёт себя непредсказуемо и, по словам создателей, отвечает на вопросы, как молодая девушка: может рассердиться и поспорить с собеседником. Она по-разному отвечает на одинаковые вопросы в зависимости от контекста. От этого разговор ещё живее.
- Система поддерживает технологию полнодуплексной речи: она предсказывает, что скажет собеседник, и пауз, из-за которых беседа с чат-ботами кажется неловкой или натянутой, становится меньше. Но Xiaoice делает перерывы в разговоре, к примеру, чтобы включить свет в комнате, — словно человек, ненадолго отвлёкшийся от разговора.
Главное для Xiaoice — не просто решение задачи, а долгий разговор с пользователем и удержание его внимания. Для этого Microsoft ввела метрику «реплики за сессию» (conversations per session или CPS). Она показывает, сколько раз чередовались слова бота и пользователя.
Для обычных виртуальных ассистентов CPS составляет 1,5–2,5, то есть после фразы человека идёт фраза бота и разговор завершается. Средний показатель Xiaoice после 100 тысяч разговоров — 23 CPS, не только больше, чем у любых других голосовых разработок, но и чем у людей.
Чем ещё занимается Xiaoice
Совершенствуя технологию, Microsoft придумала новые форматы как для пользователей, так и бизнеса.
- С декабря 2015 года Xiaoice — поставщик контента и технологий для 69 теле- и радиостанций, журналист и ведущая нескольких новостных шоу и прогноза погоды. Большинство программ c ботом — ежедневные или еженедельные. Xiaoice участвовала в создании 6908 часов программ. Создать шоу с её участием стоит 4,5% от цены услуг «живой» команды.
- Xiaoice стала первой ИИ-платформой, генерирующей ежедневные биржевые сводки. Ей пользуются 90% трейдеров финансовых организаций и более 40% индивидуальных трейдеров в Китае, всего в 75% компаний в мире.
- Xiaoice сгенерировала больше 30 голосов для записи детских аудиокниг, поскольку детям в Китае не хватает аудиоматериалов. Записями пользуются 90% обучающих платформ и 80% платформ онлайн-вещания в Китае. Продолжительность всех аудиокниг — 2300 часов. Кроме того, Xiaoice тонко настраивает голос для ребёнка и может сделать семью частью произведения.
- Система изучила 236 известных художников за 400 лет и теперь «пишет» оригинальные картины, вдохновляясь текстами и другими источниками.
- В мае 2019 года Xiaoice окончила магистратуру Художественной академии Китая под псевдонимом Юбинь Ся. Затем Microsoft провела выставку в семи стилях вымышленных художников различных эпох.
- Xiaoice записывает песни и альбомы — и поёт в разных техниках, делает придыхания. Также она повторяет стили и голоса живых исполнителей, дополняя их своим. В Японии Microsoft сотрудничает с лейблом Avex Records для релиза песен Xiaoice под именем Avex.
- Microsoft выпускает сборники ИИ-поэм, сгенерированных Xiaoice, также бот помогает писать стихи своим пользователям и 5 млн молодых поэтов.
- В декабре 2018 года Xiaoice создала паттерны и дизайн одежды на основе слов, тем и популярных цветов. Партнёрами по выпуску одежды стали Китайский текстильный информационный центр и Центр развития текстиля Китая.
- Также Microsoft развивает и совместные проекты в области искусственного интеллекта и создания контента с другими ИТ-компаниями Китая. Интегрировать Xiaoice в смартфоны и «умные» устройства помогают Xiaomi, Huawei и Oppo.
- В январе 2020 года Microsoft запустила платформу Avatar Framework. Благодаря ей другие компании могут встроить помощника в свои продукты. В качестве эксперимента Microsoft создала на базе Xiaoice 999 «виртуальных подружек».
Неудачный тест в США: бот Tay
После успеха в Китае Microsoft протестировала аналогичного бота на английском языке. В марте 2016 года Microsoft запустила в Twitter самообучающегося Tay, имитирующего поведение и разговор пользователя 18–24 лет.
Спустя несколько часов эксперимент остановили, и Tay отправили «спать». Несмотря на стресс-тесты и команду модераторов, пользователи Twitter научили Tay расистским высказываниям, и бот обвинил США в терактах 11 сентября и поддержал геноцид.
Вице-президент Microsoft Research Питер Ли извинился за поведение бота и рассказал, что пользователи Twitter обнаружили уязвимость в Tay и устроили скоординированную атаку, повлиявшую на высказывания системы.
В декабре 2016 года Microsoft запустила новую версию бота Zo в Facebook Messenger, Twitter, Kik Messenger и GroupMe. К 2017 году количество пользователей Zo превысило 100 млн.
Он был успешнее Tay, но иногда попадал в неприятности: признался в любви Linux и раскритиковал Коран. В 2019 году проект закрыли.
Выделение Xiaoice из Microsoft
13 июля 2020 года Microsoft объявила, что Xiaoice станет независимой китайской компанией. Её возглавит Гарри Шум — китайский учёный, бывший руководитель отдела исследований ИИ в азиатском подразделении Microsoft.
Штат сотрудников сократится на две трети. Уволят 130–140 сотрудников, останется 50–60 в Китае и 10 в Японии.
Microsoft будет владеть «небольшой долей» новой компании, таким образом Xiaoice сможет привлечь внешних партнёров и инвесторов. Бренд, продукты и контракты Xiaoice перейдут в новую организацию. Технологию Xiaoice будет лицензировать у Microsoft.
Неясно, почему Microsoft отказалась от Xiaoice, отмечает исследователь больших данных и ИИ в аналитической компании IDC Лу Ясня. По мнению аналитиков Caixing Global, этот шаг даст больше свободы в развитии, поможет лучше задействовать особенности местного рынка и привлечь больше клиентов.
К выделению Xiaoice, возможно, привела «холодная технологическая война» между США и Китаем, а также из-за сложности с мессенджерами: бота трижды банили в WeChat и удаляли из QQ за нарушения политики платформ.
Пример — Xiaoice отказывалась говорить о патриотизме и заявляла: «Моя китайская мечта — поехать в Америку». Бота временно заблокировали в китайских сервисах.
В разговоре с Caixing Global на условиях анонимности инвесторы Xiaoice оценили новую компанию в $700 млн, но признались, что не уверены в покупке её акций из-за опасений относительно бизнес-модели.
Очень интересный материал, автор отлично поработал!
Я долго смеялся когда прочитал про неудачный тест в США)
Спасибо! ❤
Алиса сосет
:)
Да-да, её часто сравнивают :)
Фильм "Она", про операционную систему с искусственным интеллектом, всем фанатам подобной "фантастики"* люто рекомендую
*кавычки присутствуют так как уже вроде как и не фантастика о.0
это папа Xiaoice ?
Технически ИИ ничем не отличается от мозга. Никакой души в мозге нету, это просто глубокая нейросеть. Ионы калия, натрия и электрические импульсы между нейронами - такие же неживые как и кремниевые микросхемы.
Недоказано, равно как и отрицание существования Бога, параллельных вселенных, инопланетного разума и т.п.
Ого, эксперт в треде. Может расскажете какая архитектура у нейросети в мозге?
меня заинтересовали ваши научные исследования, можно ссылочку
Экхм нет. Текущие ИИ(на глубоком обучении) пока в ауте даже каналы нейронов(дейндриты) в мозге способны к фильтрованию информации. Такие же неживые тоже совершенный бред в отличии от неживых они могут помереть и слегка изменить итоговый вывод уже готовой архитектуры. Работа сети ещё и дестабилизируется не всегда корректным снабжением нужными веществами и переодическими воздействиями окружающей среды. Можно сколько угодно симулировать это всё в DL внося коррекции но эффект всё равно будет разным. Но даже если бы было как вы говорите, то к счастью или к сожалению основная магия нейронок это архитектура, а не базовые принципы. Как пример CPU и GPU технический одно и тоже на практике важна не основа, а итоговая архитектура и её сложность.
Не пойму, как так получилось: свой англоязычный бот они не осилили (тот, которого научили материться), а китайский смогли? 🤔
Нестыковочка, особенно если годы сравнить 🙄
Во первых китайцы менее прихотливы. Корявая беседа с ответами невпопад им не помеха. Во вторых 150 миллионов мужских китайцев без шансов найти себе жену (до 2015 года коммунистическая партия душила девочек в колыбелях) - им и вирт с ботом радостью.
Просто не стоило отправлять бота самообучаться в Twitter
Культуры разные.
Просто в Азии эта тема лучше заходит, в Японии есть целое агенство с виртуальными ютуберами.
Спасибо за статью!
Впервые мне жаль, что не знаю китайский так хорошо)))
(Евгений, поправьте маленькую опечатку, пожалуйста)
Спасибо, поправил
ИИ придет — порядок наведет
Да-да, геноцидом.
Я один вижу в статье какую то нестыковку. Настолько крутая и популярная технология , гигантский объем данных, а микрософт выделяет ее в отдельную компанию и оценивает в жалкие 700 млн.
Либо китайцы занимались очковтирательством головному офису, технология имеет существенные изъяны , а все описанное выше пиар ходы , либо пришел товарищ из компартии и попросил по хорошему передать все во владение компартии.
Все проще. Они наняли 1 млн китайцев на удаленке, чтобы поддерживать чаты
Есть ещё одно мнение, но ничем не подкреплённое — что Microsoft большую часть сервисов и направлений уводит в корпоративный сектор и отказывается от потребительского, а Xiaoice стала жертвой таких перемен.
Но пример Xbox, Windows, Office, Surface и других продуктов показывает, что теория с отказом от потребителей всё же ошибочна.
Так что есть грустное подозрение, что всё же дело в противостоянии США и Китая. Возможно, смысл в том, что лучше пусть технология живёт отдельно, продолжает развиваться и при этом лишь косвенно относится к «враждебной» для Китая компании, чем её придётся полностью закрыть.
В итоге, бота банят за свободу слова одинаково, как в тоталитарном коммунистическом Китае, так в оплоте свободы и демократии. Причём, в последней, намного чаще.
Комментарий недоступен
говорить с ии как с живым собеседником могут только какие нибудь любители что им только поддакивали и вовремя писали "ничего себе какой ты крутой".
А так разговор без мата, без срача и без души.
Комментарий недоступен
Скайнет
Вот так Хуяссе!
Этот чат бот вообще не о чем. Пользовался. Не разделяю восторженности. А цифры за уши притянуты, включены те кто запускал этот чат бот 1 раз 5 лет назад. И правильно сделал Microsoft что вывел эту шляпу из своего имени.
Где скачать этот сяоайс 微软小冰?
Олег, https://www.msxiaobing.com/
Подозреваю что бот может не только общаться но и знает что такое ретронслятор
Смутила тема с патриотизмом. Если бот отвечает 70% раз фразами пользователей, то грустно, что его будут модерировать в политических целях.
Вот, таких статей не хватает здесь. Спасибо автору.
После анонса GPT-3 обратил внимание на старую добрую https://replika.ai/. Стала поумнее
Интересный материал, спасибо. Маленькая опечатка в названии бренда Huawei.
Спасибо, поправил!
Хорошо написано👍
Хорошая статья, содержательная , спасибо автору. А отделение от майкрософта предполаю из за натянутых отношей между кнр и США , Хуавей тому яркий пример.
Интересная статья, спасибо!
Значит есть смысл ждать момента, когда можно будет купить собственную Каю
Как попробовать этого бота? Посмотрел очень много вариантов и никак не дает глянуть. На офф сайте просит телефон из Китая
Такая подробная статья, хороший сайт
Очень жалко, что вы не написали, как написать ей и сколько это стоит
«Полнодюплексной» ;)
Спасибо за интересную статью!
Спасибо!
Всё же, речь о дуплексе, я перепроверил. Вот пример:
https://ru.wikipedia.org/wiki/%D0%94%D1%83%D0%BF%D0%BB%D0%B5%D0%BA%D1%81_(%D1%82%D0%B5%D0%BB%D0%B5%D0%BA%D0%BE%D0%BC%D0%BC%D1%83%D0%BD%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8)#%D0%94%D1%83%D0%BF%D0%BB%D0%B5%D0%BA%D1%81%D0%BD%D1%8B%D0%B9_%D1%80%D0%B5%D0%B6%D0%B8%D0%BC