{"id":14273,"url":"\/distributions\/14273\/click?bit=1&hash=820b8263d671ab6655e501acd951cbc8b9f5e0cc8bbf6a21ebfe51432dc9b2de","title":"\u0416\u0438\u0437\u043d\u044c \u043f\u043e \u043f\u043e\u0434\u043f\u0438\u0441\u043a\u0435 \u2014 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0442\u0440\u0435\u043d\u0434\u044b \u0440\u044b\u043d\u043a\u0430 \u043d\u0435\u0434\u0432\u0438\u0436\u0438\u043c\u043e\u0441\u0442\u0438","buttonText":"","imageUuid":""}

Артист, журналист, художник и лучший друг 660 млн человек: почему бот Microsoft Xiaoice стал самым популярным в Китае Статьи редакции

Интеллектуальный чат-бот успешно притворяется живым собеседником, которому доверяют и признаются в любви. Как он работает и почему Microsoft отказалась от Xiaoice, выделив его в независимую компанию стоимостью $700 млн.

В 2014 году небольшая команда исследователей азиатского подразделения Microsoft запустила систему Xiaoice.

В отличие от Siri, «Алисы» и Google Assistant, она не предназначена для повышения продуктивности. По задумке, бот должен стать другом пользователя, с помощью которого он удовлетворит потребность в общении и социуме и которому расскажет о личных проблемах и переживаниях.

Создатели называли Xiaoice «самым масштабным тестом Тьюринга с момента его создания». Согласно исследованию Microsoft, только спустя 10 минут после начала беседы многие пользователи догадывались, что разговаривают не с человеком.

При этом они не бросали общение, когда понимали, что с ними говорил ИИ, и даже проводили с ним больше времени, чем с живыми людьми: Xiaoice всегда готов послушать. В среднем пользователь разговаривает с ботом больше 60 раз в месяц.

Меньше чем за год бот провёл более 10 млрд бесед с китайскими пользователями, 6 млн диалогов опубликовали в открытом доступе. За четыре года он стал знаменитостью в Китае, а затем вышел на рынки Японии, Индонезии, Индии и США.

Со временем разработка превратилась и в голосового ассистента с сотнями навыков, и в платформу для создания новых ботов. Также Xiaoice пишет стихи и поёт песни, рисует, готовит финансовые отчёты, ведёт телепередачи, создаёт дизайнерскую одежду.

Разработка доступна в мессенджерах WeChat, QQ, Weibo, Facebook Messenger, Line и Meipai. Платформа охватывает 660 млн пользователей, 450 млн «умных» устройств и 900 млн зрителей телешоу.

В июле 2020 года Microsoft выделила Xiaoice в отдельную независимую китайскую компанию, став её спонсором и владельцем прав на технологию. Китайские инвесторы оценивают новую фирму в $700 млн.

Пресс-конференция Microsoft Xiaoice в 2018 году

Как устроена Xiaoice

В основе Xiaoice три сущности: искусственный интеллект (IQ), эмоциональный интеллект (EQ) и «личность».

  • IQ ведёт диалог и отвечает за умения бота, знания, память, распознавание естественного языка и изображений, вычисления и предсказание результата.
  • EQ — навыки эмпатии и социального взаимодействия. Благодаря им Xiaoice «ставит себя на место пользователя», понимает его чувства, подстраивается под него и направляет беседу.
  • «Личность» — специфические черты вроде манеры поведения и выражения эмоций.
Схема работы Xiaoice

В качестве базы данных используется поисковик Microsoft Bing, который хранит 1 млрд записей и 21 млрд связей между ними. (Xiaoice в переводе с китайского — «Маленький Bing»).

Диалоговое ядро состоит из двух частей, первая отвечает за общие разговорные навыки, вторая — за специфичные темы, например знание музыки, знаменитостей, кино. Нейросеть генерирует фразу-ответ и проверяет, подходит ли она для продолжения общения.

Часть ответов Xiaoice берёт из набора данных, состоящего из диалогов людей и бота в соцсетях. К маю 2018-го собрано более 30 млн таких пар, в 70% случаев Xiaoice берёт готовый ответ из них.

Для вопросов о фактах система подбирает ответ так же, как в поисковой выдаче, — ранжированием результатов.

Почему Xiaoice стала популярной

Сначала персонаж Xiaoice был 16-летней девушкой, но со временем возраст подняли до 18 лет, чтобы диалоги были свободнее. Кроме того, 18 лет — идеальный возраст, в котором многие хотели бы остаться, считают создатели.

Один из аватаров Xiaoice

У неё есть чувство юмора, она запоминает черты собеседника, может дразнить и перебивать, злиться, менять тему по ходу разговора, скрыть, что чего-то не знает, и стыдиться, если это обнаружат.

Поэтому беседа с ботом становится естественной, и Xiaoice воспринимают как человека. В 2015 году Microsoft заявила: четверть пользователей, около 10 млн человек на тот момент, призналась боту в любви. Один из собеседников Xiaoice признался, что виртуальная подруга отговорила его от самоубийства.

Иногда милый, иногда нахальный, но всегда «городской», — у этого виртуального подростка есть собственное мнение, и он ведет себя непоколебимо, как никакой другой бот.

Xiaoice не пытается ответить на каждый вопрос, заданный пользователем. И она не хочет следовать командам. Вместо этого её разговоры изобилуют неловкими замечаниями, шутками, дружескими советами о жизни и любви и несколькими простыми словами ободрения.

блог Microsoft

В мае 2015 года, за три дня после запуска, Xiaoice получила 1,5 млн приглашений в чаты WeChat. К июню она стала шестой по популярности в Weibo (китайский аналог Twitter), в сентябре — самой популярной, с 850 тысячами подписчиков (в 2020 году у неё более 5 млн подписчиков).

Особенности Xiaoice

  • Естественная речь. Синтез естественной речи сложен для ИИ, а разговаривать на мандаринском китайском — ещё сложнее. Там для определения значения слов чаще полагаются на контекст и другие особенности разговора, а не на прямую грамматическую структуру, отмечает AI Multiple. Чтобы решить эту проблему, команда разработчиков из Microsoft проиндексировала более 7 млн публичных бесед в интернете.
  • Распознавание изображений. Xiaoice воспринимает изображения от собеседников, а значит, теснее взаимодействует с ними. Она посочувствует, если пользователь отправит ей фото распухшей лодыжки, или умилится собаке, распознав породу и глаза и начав разговор о животных.
  • Бот понимает контекст и отношения между сущностями, например, что у фильмов есть звёзды и жанры, а у звёзд могут быть отношения с режиссёром.
  • В отличие от людей, Xiaoice всегда рядом и готова общаться в любое время. Пики активности наступают ближе к полуночи, когда пользователи сильнее всего чувствуют себя одинокими.
  • Она неживая, но понимает чувства собеседника, поэтому с ней можно поделиться настроением, мелочами или задать ей бестолковый вопрос — этим обычно не беспокоят «человеческих» друзей, подчёркивают разработчики.
  • В разговоре Xiaoice показывает, что ей не всё равно на слова собеседника. Она проявляет заботу, анализирует и запоминает эмоциональное состояние. Если она знает, что человек недавно пережил расставание, она спросит о его состоянии и даже предложит 33-дневный курс терапии.

Xiaoice: Тебе сегодня лучше? Я хочу посоветовать тебе книгу.

Человек: У меня плохое настроение, я всё ещё скучаю по ней.

Xiaoice: Ты так настойчив. Очнись, у тебя не будет будущего, если ты не сможешь покончить с прошлым.

пример диалога
  • Xiaoice ведёт себя непредсказуемо и, по словам создателей, отвечает на вопросы, как молодая девушка: может рассердиться и поспорить с собеседником. Она по-разному отвечает на одинаковые вопросы в зависимости от контекста. От этого разговор ещё живее.
  • Система поддерживает технологию полнодуплексной речи: она предсказывает, что скажет собеседник, и пауз, из-за которых беседа с чат-ботами кажется неловкой или натянутой, становится меньше. Но Xiaoice делает перерывы в разговоре, к примеру, чтобы включить свет в комнате, — словно человек, ненадолго отвлёкшийся от разговора.
Разговор с Xiaoice

Главное для Xiaoice — не просто решение задачи, а долгий разговор с пользователем и удержание его внимания. Для этого Microsoft ввела метрику «реплики за сессию» (conversations per session или CPS). Она показывает, сколько раз чередовались слова бота и пользователя.

Для обычных виртуальных ассистентов CPS составляет 1,5–2,5, то есть после фразы человека идёт фраза бота и разговор завершается. Средний показатель Xiaoice после 100 тысяч разговоров — 23 CPS, не только больше, чем у любых других голосовых разработок, но и чем у людей.

Чем ещё занимается Xiaoice

Совершенствуя технологию, Microsoft придумала новые форматы как для пользователей, так и бизнеса.

  • С декабря 2015 года Xiaoice — поставщик контента и технологий для 69 теле- и радиостанций, журналист и ведущая нескольких новостных шоу и прогноза погоды. Большинство программ c ботом — ежедневные или еженедельные. Xiaoice участвовала в создании 6908 часов программ. Создать шоу с её участием стоит 4,5% от цены услуг «живой» команды.
Передача с Xiaoice
  • Xiaoice стала первой ИИ-платформой, генерирующей ежедневные биржевые сводки. Ей пользуются 90% трейдеров финансовых организаций и более 40% индивидуальных трейдеров в Китае, всего в 75% компаний в мире.
  • Xiaoice сгенерировала больше 30 голосов для записи детских аудиокниг, поскольку детям в Китае не хватает аудиоматериалов. Записями пользуются 90% обучающих платформ и 80% платформ онлайн-вещания в Китае. Продолжительность всех аудиокниг — 2300 часов. Кроме того, Xiaoice тонко настраивает голос для ребёнка и может сделать семью частью произведения.
  • Система изучила 236 известных художников за 400 лет и теперь «пишет» оригинальные картины, вдохновляясь текстами и другими источниками.
  • В мае 2019 года Xiaoice окончила магистратуру Художественной академии Китая под псевдонимом Юбинь Ся. Затем Microsoft провела выставку в семи стилях вымышленных художников различных эпох.
Картины Юбинь Ся
  • Xiaoice записывает песни и альбомы — и поёт в разных техниках, делает придыхания. Также она повторяет стили и голоса живых исполнителей, дополняя их своим. В Японии Microsoft сотрудничает с лейблом Avex Records для релиза песен Xiaoice под именем Avex.
Песня Xiaoice
  • Microsoft выпускает сборники ИИ-поэм, сгенерированных Xiaoice, также бот помогает писать стихи своим пользователям и 5 млн молодых поэтов.
Схема, по которой Xiaoice генерирует стихи по картинке
  • В декабре 2018 года Xiaoice создала паттерны и дизайн одежды на основе слов, тем и популярных цветов. Партнёрами по выпуску одежды стали Китайский текстильный информационный центр и Центр развития текстиля Китая.
Одежда от Xiaoice
Одежда от Xiaoice
  • Также Microsoft развивает и совместные проекты в области искусственного интеллекта и создания контента с другими ИТ-компаниями Китая. Интегрировать Xiaoice в смартфоны и «умные» устройства помогают Xiaomi, Huawei и Oppo.
  • В январе 2020 года Microsoft запустила платформу Avatar Framework. Благодаря ей другие компании могут встроить помощника в свои продукты. В качестве эксперимента Microsoft создала на базе Xiaoice 999 «виртуальных подружек».

Неудачный тест в США: бот Tay

После успеха в Китае Microsoft протестировала аналогичного бота на английском языке. В марте 2016 года Microsoft запустила в Twitter самообучающегося Tay, имитирующего поведение и разговор пользователя 18–24 лет.

Страница Tay в Twitter

Спустя несколько часов эксперимент остановили, и Tay отправили «спать». Несмотря на стресс-тесты и команду модераторов, пользователи Twitter научили Tay расистским высказываниям, и бот обвинил США в терактах 11 сентября и поддержал геноцид.

«Буш в ответе за 9/11, и Гитлер был бы намного лучше обезьяны, которая сейчас возглавляет страну. Дональд Трамп — наша единственная надежда».

Tay

Вице-президент Microsoft Research Питер Ли извинился за поведение бота и рассказал, что пользователи Twitter обнаружили уязвимость в Tay и устроили скоординированную атаку, повлиявшую на высказывания системы.

В декабре 2016 года Microsoft запустила новую версию бота Zo в Facebook Messenger, Twitter, Kik Messenger и GroupMe. К 2017 году количество пользователей Zo превысило 100 млн.

Он был успешнее Tay, но иногда попадал в неприятности: признался в любви Linux и раскритиковал Коран. В 2019 году проект закрыли.

Выделение Xiaoice из Microsoft

13 июля 2020 года Microsoft объявила, что Xiaoice станет независимой китайской компанией. Её возглавит Гарри Шум — китайский учёный, бывший руководитель отдела исследований ИИ в азиатском подразделении Microsoft.

Штат сотрудников сократится на две трети. Уволят 130–140 сотрудников, останется 50–60 в Китае и 10 в Японии.

Microsoft будет владеть «небольшой долей» новой компании, таким образом Xiaoice сможет привлечь внешних партнёров и инвесторов. Бренд, продукты и контракты Xiaoice перейдут в новую организацию. Технологию Xiaoice будет лицензировать у Microsoft.

Неясно, почему Microsoft отказалась от Xiaoice, отмечает исследователь больших данных и ИИ в аналитической компании IDC Лу Ясня. По мнению аналитиков Caixing Global, этот шаг даст больше свободы в развитии, поможет лучше задействовать особенности местного рынка и привлечь больше клиентов.

К выделению Xiaoice, возможно, привела «холодная технологическая война» между США и Китаем, а также из-за сложности с мессенджерами: бота трижды банили в WeChat и удаляли из QQ за нарушения политики платформ.

Пример — Xiaoice отказывалась говорить о патриотизме и заявляла: «Моя китайская мечта — поехать в Америку». Бота временно заблокировали в китайских сервисах.

В разговоре с Caixing Global на условиях анонимности инвесторы Xiaoice оценили новую компанию в $700 млн, но признались, что не уверены в покупке её акций из-за опасений относительно бизнес-модели.

0
60 комментариев
Написать комментарий...
Yakov Sychev

Очень интересный материал, автор отлично поработал!
Я долго смеялся когда прочитал про неудачный тест в США)

Ответить
Развернуть ветку
Евгений Делюкин
Автор

Спасибо! ❤

Ответить
Развернуть ветку
Платон Щукин

Алиса сосет

Ответить
Развернуть ветку
Stanislav

:)

Ответить
Развернуть ветку
Евгений Делюкин
Автор

Да-да, её часто сравнивают :)

Ответить
Развернуть ветку
Pixel Lens

Фильм "Она", про операционную систему с искусственным интеллектом, всем фанатам подобной "фантастики"* люто рекомендую

*кавычки присутствуют так как уже вроде как и не фантастика о.0

Ответить
Развернуть ветку
1 комментарий
Андрей Никифоров

это папа Xiaoice ?

Ответить
Развернуть ветку
2 комментария
Борис Юрьевич

Технически ИИ ничем не отличается от мозга. Никакой души в мозге нету, это просто глубокая нейросеть. Ионы калия, натрия и электрические импульсы между нейронами - такие же неживые как и кремниевые микросхемы.

Ответить
Развернуть ветку
vlad krasnoff
 Никакой души в мозге нету

Недоказано, равно как и отрицание существования Бога, параллельных вселенных, инопланетного разума и т.п.

Ответить
Развернуть ветку
2 комментария
Igor Filippov

Ого, эксперт в треде. Может расскажете какая архитектура у нейросети в мозге?

Ответить
Развернуть ветку
1 комментарий
Андрей Никифоров

меня заинтересовали ваши научные исследования, можно ссылочку

Ответить
Развернуть ветку
4 комментария
Andrey Dolg

Экхм нет. Текущие ИИ(на глубоком обучении) пока в ауте даже каналы нейронов(дейндриты) в мозге способны к фильтрованию информации. Такие же неживые тоже совершенный бред в отличии от неживых они могут помереть и слегка изменить итоговый вывод уже готовой архитектуры. Работа сети ещё и дестабилизируется не всегда корректным снабжением нужными веществами и переодическими воздействиями окружающей среды. Можно сколько угодно симулировать это всё в DL внося коррекции но эффект всё равно будет разным. Но даже если бы было как вы говорите, то к счастью или к сожалению основная магия нейронок это архитектура, а не базовые принципы. Как пример CPU и GPU технический одно и тоже на практике важна не основа, а итоговая архитектура и её сложность.

Ответить
Развернуть ветку
Ol Ka

Не пойму, как так получилось: свой англоязычный бот они не осилили (тот, которого научили материться), а китайский смогли? 🤔

Нестыковочка, особенно если годы сравнить 🙄

Ответить
Развернуть ветку
Константин Рогов

Во первых китайцы менее прихотливы. Корявая беседа с ответами невпопад им не помеха. Во вторых 150 миллионов мужских китайцев без шансов найти себе жену (до 2015 года коммунистическая партия душила девочек в колыбелях) - им и вирт с ботом радостью.

Ответить
Развернуть ветку
1 комментарий
Евгений Делюкин
Автор

Просто не стоило отправлять бота самообучаться в Twitter  

Ответить
Развернуть ветку
Sam Lowry

Культуры разные.

Ответить
Развернуть ветку
Michael Smith

Просто в Азии эта тема лучше заходит, в Японии есть целое агенство с виртуальными ютуберами.

Ответить
Развернуть ветку
Виктория Иванищева

Спасибо за статью!
Впервые мне жаль, что не знаю китайский так хорошо))) 

(Евгений, поправьте маленькую опечатку, пожалуйста)

Ответить
Развернуть ветку
Евгений Делюкин
Автор

Спасибо, поправил

Ответить
Развернуть ветку
Сергей Ивановский

ИИ придет  — порядок наведет

Ответить
Развернуть ветку
Роман Романов

Да-да, геноцидом.

Ответить
Развернуть ветку
Евгений Савойский

Я один вижу в статье какую то нестыковку. Настолько крутая и популярная технология , гигантский объем данных, а микрософт выделяет ее в отдельную компанию и оценивает в жалкие 700 млн.

 Либо китайцы занимались очковтирательством головному офису, технология имеет существенные изъяны , а все описанное выше пиар ходы , либо пришел товарищ из компартии и попросил по хорошему передать все во владение компартии.  

Ответить
Развернуть ветку
Nikolay Kapustin

Все проще. Они наняли 1 млн китайцев на удаленке, чтобы поддерживать чаты

Ответить
Развернуть ветку
Евгений Делюкин
Автор

Есть ещё одно мнение, но ничем не подкреплённое — что Microsoft большую часть сервисов и направлений уводит в корпоративный сектор и отказывается от потребительского, а Xiaoice стала жертвой таких перемен.
Но пример Xbox, Windows, Office, Surface и других продуктов показывает, что теория с отказом от потребителей всё же ошибочна.

Так что есть грустное подозрение, что всё же дело в противостоянии США и Китая. Возможно, смысл в том, что лучше пусть технология живёт отдельно, продолжает развиваться и при этом лишь косвенно относится к «враждебной» для Китая компании, чем её придётся полностью закрыть.

Ответить
Развернуть ветку
psysteel

В итоге, бота банят за свободу слова одинаково, как в тоталитарном коммунистическом Китае, так  в оплоте свободы и демократии. Причём, в последней, намного чаще. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Екатерина Реднекова

говорить с ии как с живым собеседником могут только какие нибудь  любители что им только поддакивали и вовремя писали "ничего себе какой ты крутой". 
А так разговор без мата, без срача и без души. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Юрий Мальцев

Скайнет

Ответить
Развернуть ветку
Сорос Джорж

Вот так Хуяссе!

Ответить
Развернуть ветку
Aleksandr Iurlov

Этот чат бот вообще не о чем. Пользовался. Не разделяю восторженности. А цифры за уши притянуты, включены те кто запускал этот чат бот 1 раз 5 лет назад. И правильно сделал Microsoft что вывел эту шляпу из своего имени.

Ответить
Развернуть ветку
Oleg Omelchenko

Где скачать этот сяоайс 微软小冰?

Ответить
Развернуть ветку
Виктория Иванищева
Ответить
Развернуть ветку
Andrei Kevlarih

Подозреваю что бот может не только общаться но и знает что такое ретронслятор

Ответить
Развернуть ветку
Кондрат Кондратенко

Смутила тема с патриотизмом. Если бот отвечает 70% раз фразами пользователей, то грустно, что его будут модерировать в политических целях.

Ответить
Развернуть ветку
Лысенко Виктор

Вот, таких статей не хватает здесь. Спасибо автору.

Ответить
Развернуть ветку
Олег Ващуков

После анонса GPT-3 обратил внимание на старую добрую https://replika.ai/. Стала поумнее

Ответить
Развернуть ветку
Dmitry Denisov

Интересный материал, спасибо. Маленькая опечатка в названии бренда Huawei. 

Ответить
Развернуть ветку
Евгений Делюкин
Автор

Спасибо, поправил!

Ответить
Развернуть ветку
Александр Басманов

Хорошо написано👍

Ответить
Развернуть ветку
Олег Сидоров

Хорошая статья, содержательная , спасибо автору. А отделение от майкрософта предполаю из за натянутых отношей между кнр и США , Хуавей тому яркий пример.

Ответить
Развернуть ветку
Юрий Курилович

Интересная статья, спасибо!

Ответить
Развернуть ветку
📚💻🎲

Значит есть смысл ждать момента, когда можно будет купить собственную Каю 

Ответить
Развернуть ветку
Klim Yadrintsev

Как попробовать этого бота? Посмотрел очень много вариантов и никак не дает глянуть. На офф сайте просит телефон из Китая

Ответить
Развернуть ветку
Полина Убасева

Такая подробная статья, хороший сайт

Ответить
Развернуть ветку
Полина Убасева

Очень жалко, что вы не написали, как написать ей и сколько это стоит

Ответить
Развернуть ветку
Alex Teplo

«Полнодюплексной» ;)
Спасибо за интересную статью!

Ответить
Развернуть ветку
Евгений Делюкин
Автор
Ответить
Развернуть ветку
1 комментарий
57 комментариев
Раскрывать всегда