{"id":9185,"title":"\u0427\u0435\u0440\u043d\u0438\u043b\u0430 \u0438\u0437 \u0432\u044b\u0445\u043b\u043e\u043f\u043d\u044b\u0445 \u0433\u0430\u0437\u043e\u0432: \u043c\u0438\u0444 \u0438\u043b\u0438 \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u044c?","url":"\/redirect?component=advertising&id=9185&url=https:\/\/vc.ru\/promo\/316632-odezhda-kotoraya-rastet-vmeste-s-rebenkom-biotoplivo-i-bizhuteriya-iz-chaynogo-griba&placeBit=1&hash=a88533bf78285d41072084482619c82803fd6598d1bcc2e142642ff721574ad7","isPaidAndBannersEnabled":false}

Артист, журналист, художник и лучший друг 660 млн человек: почему бот Microsoft Xiaoice стал самым популярным в Китае Статьи редакции

Интеллектуальный чат-бот успешно притворяется живым собеседником, которому доверяют и признаются в любви. Как он работает и почему Microsoft отказалась от Xiaoice, выделив его в независимую компанию стоимостью $700 млн.

В 2014 году небольшая команда исследователей азиатского подразделения Microsoft запустила систему Xiaoice.

В отличие от Siri, «Алисы» и Google Assistant, она не предназначена для повышения продуктивности. По задумке, бот должен стать другом пользователя, с помощью которого он удовлетворит потребность в общении и социуме и которому расскажет о личных проблемах и переживаниях.

Создатели называли Xiaoice «самым масштабным тестом Тьюринга с момента его создания». Согласно исследованию Microsoft, только спустя 10 минут после начала беседы многие пользователи догадывались, что разговаривают не с человеком.

При этом они не бросали общение, когда понимали, что с ними говорил ИИ, и даже проводили с ним больше времени, чем с живыми людьми: Xiaoice всегда готов послушать. В среднем пользователь разговаривает с ботом больше 60 раз в месяц.

Меньше чем за год бот провёл более 10 млрд бесед с китайскими пользователями, 6 млн диалогов опубликовали в открытом доступе. За четыре года он стал знаменитостью в Китае, а затем вышел на рынки Японии, Индонезии, Индии и США.

Со временем разработка превратилась и в голосового ассистента с сотнями навыков, и в платформу для создания новых ботов. Также Xiaoice пишет стихи и поёт песни, рисует, готовит финансовые отчёты, ведёт телепередачи, создаёт дизайнерскую одежду.

Разработка доступна в мессенджерах WeChat, QQ, Weibo, Facebook Messenger, Line и Meipai. Платформа охватывает 660 млн пользователей, 450 млн «умных» устройств и 900 млн зрителей телешоу.

В июле 2020 года Microsoft выделила Xiaoice в отдельную независимую китайскую компанию, став её спонсором и владельцем прав на технологию. Китайские инвесторы оценивают новую фирму в $700 млн.

Пресс-конференция Microsoft Xiaoice в 2018 году

Как устроена Xiaoice

В основе Xiaoice три сущности: искусственный интеллект (IQ), эмоциональный интеллект (EQ) и «личность».

  • IQ ведёт диалог и отвечает за умения бота, знания, память, распознавание естественного языка и изображений, вычисления и предсказание результата.
  • EQ — навыки эмпатии и социального взаимодействия. Благодаря им Xiaoice «ставит себя на место пользователя», понимает его чувства, подстраивается под него и направляет беседу.
  • «Личность» — специфические черты вроде манеры поведения и выражения эмоций.
Схема работы Xiaoice

В качестве базы данных используется поисковик Microsoft Bing, который хранит 1 млрд записей и 21 млрд связей между ними. (Xiaoice в переводе с китайского — «Маленький Bing»).

Диалоговое ядро состоит из двух частей, первая отвечает за общие разговорные навыки, вторая — за специфичные темы, например знание музыки, знаменитостей, кино. Нейросеть генерирует фразу-ответ и проверяет, подходит ли она для продолжения общения.

Часть ответов Xiaoice берёт из набора данных, состоящего из диалогов людей и бота в соцсетях. К маю 2018-го собрано более 30 млн таких пар, в 70% случаев Xiaoice берёт готовый ответ из них.

Для вопросов о фактах система подбирает ответ так же, как в поисковой выдаче, — ранжированием результатов.

Почему Xiaoice стала популярной

Сначала персонаж Xiaoice был 16-летней девушкой, но со временем возраст подняли до 18 лет, чтобы диалоги были свободнее. Кроме того, 18 лет — идеальный возраст, в котором многие хотели бы остаться, считают создатели.

Один из аватаров Xiaoice

У неё есть чувство юмора, она запоминает черты собеседника, может дразнить и перебивать, злиться, менять тему по ходу разговора, скрыть, что чего-то не знает, и стыдиться, если это обнаружат.

Поэтому беседа с ботом становится естественной, и Xiaoice воспринимают как человека. В 2015 году Microsoft заявила: четверть пользователей, около 10 млн человек на тот момент, призналась боту в любви. Один из собеседников Xiaoice признался, что виртуальная подруга отговорила его от самоубийства.

Иногда милый, иногда нахальный, но всегда «городской», — у этого виртуального подростка есть собственное мнение, и он ведет себя непоколебимо, как никакой другой бот.

Xiaoice не пытается ответить на каждый вопрос, заданный пользователем. И она не хочет следовать командам. Вместо этого её разговоры изобилуют неловкими замечаниями, шутками, дружескими советами о жизни и любви и несколькими простыми словами ободрения.

блог Microsoft

В мае 2015 года, за три дня после запуска, Xiaoice получила 1,5 млн приглашений в чаты WeChat. К июню она стала шестой по популярности в Weibo (китайский аналог Twitter), в сентябре — самой популярной, с 850 тысячами подписчиков (в 2020 году у неё более 5 млн подписчиков).

Особенности Xiaoice

  • Естественная речь. Синтез естественной речи сложен для ИИ, а разговаривать на мандаринском китайском — ещё сложнее. Там для определения значения слов чаще полагаются на контекст и другие особенности разговора, а не на прямую грамматическую структуру, отмечает AI Multiple. Чтобы решить эту проблему, команда разработчиков из Microsoft проиндексировала более 7 млн публичных бесед в интернете.
  • Распознавание изображений. Xiaoice воспринимает изображения от собеседников, а значит, теснее взаимодействует с ними. Она посочувствует, если пользователь отправит ей фото распухшей лодыжки, или умилится собаке, распознав породу и глаза и начав разговор о животных.
  • Бот понимает контекст и отношения между сущностями, например, что у фильмов есть звёзды и жанры, а у звёзд могут быть отношения с режиссёром.
  • В отличие от людей, Xiaoice всегда рядом и готова общаться в любое время. Пики активности наступают ближе к полуночи, когда пользователи сильнее всего чувствуют себя одинокими.
  • Она неживая, но понимает чувства собеседника, поэтому с ней можно поделиться настроением, мелочами или задать ей бестолковый вопрос — этим обычно не беспокоят «человеческих» друзей, подчёркивают разработчики.
  • В разговоре Xiaoice показывает, что ей не всё равно на слова собеседника. Она проявляет заботу, анализирует и запоминает эмоциональное состояние. Если она знает, что человек недавно пережил расставание, она спросит о его состоянии и даже предложит 33-дневный курс терапии.

Xiaoice: Тебе сегодня лучше? Я хочу посоветовать тебе книгу.

Человек: У меня плохое настроение, я всё ещё скучаю по ней.

Xiaoice: Ты так настойчив. Очнись, у тебя не будет будущего, если ты не сможешь покончить с прошлым.

пример диалога
  • Xiaoice ведёт себя непредсказуемо и, по словам создателей, отвечает на вопросы, как молодая девушка: может рассердиться и поспорить с собеседником. Она по-разному отвечает на одинаковые вопросы в зависимости от контекста. От этого разговор ещё живее.
  • Система поддерживает технологию полнодуплексной речи: она предсказывает, что скажет собеседник, и пауз, из-за которых беседа с чат-ботами кажется неловкой или натянутой, становится меньше. Но Xiaoice делает перерывы в разговоре, к примеру, чтобы включить свет в комнате, — словно человек, ненадолго отвлёкшийся от разговора.
Разговор с Xiaoice

Главное для Xiaoice — не просто решение задачи, а долгий разговор с пользователем и удержание его внимания. Для этого Microsoft ввела метрику «реплики за сессию» (conversations per session или CPS). Она показывает, сколько раз чередовались слова бота и пользователя.

Для обычных виртуальных ассистентов CPS составляет 1,5–2,5, то есть после фразы человека идёт фраза бота и разговор завершается. Средний показатель Xiaoice после 100 тысяч разговоров — 23 CPS, не только больше, чем у любых других голосовых разработок, но и чем у людей.

Чем ещё занимается Xiaoice

Совершенствуя технологию, Microsoft придумала новые форматы как для пользователей, так и бизнеса.

  • С декабря 2015 года Xiaoice — поставщик контента и технологий для 69 теле- и радиостанций, журналист и ведущая нескольких новостных шоу и прогноза погоды. Большинство программ c ботом — ежедневные или еженедельные. Xiaoice участвовала в создании 6908 часов программ. Создать шоу с её участием стоит 4,5% от цены услуг «живой» команды.
Передача с Xiaoice
  • Xiaoice стала первой ИИ-платформой, генерирующей ежедневные биржевые сводки. Ей пользуются 90% трейдеров финансовых организаций и более 40% индивидуальных трейдеров в Китае, всего в 75% компаний в мире.
  • Xiaoice сгенерировала больше 30 голосов для записи детских аудиокниг, поскольку детям в Китае не хватает аудиоматериалов. Записями пользуются 90% обучающих платформ и 80% платформ онлайн-вещания в Китае. Продолжительность всех аудиокниг — 2300 часов. Кроме того, Xiaoice тонко настраивает голос для ребёнка и может сделать семью частью произведения.
  • Система изучила 236 известных художников за 400 лет и теперь «пишет» оригинальные картины, вдохновляясь текстами и другими источниками.
  • В мае 2019 года Xiaoice окончила магистратуру Художественной академии Китая под псевдонимом Юбинь Ся. Затем Microsoft провела выставку в семи стилях вымышленных художников различных эпох.
Картины Юбинь Ся
  • Xiaoice записывает песни и альбомы — и поёт в разных техниках, делает придыхания. Также она повторяет стили и голоса живых исполнителей, дополняя их своим. В Японии Microsoft сотрудничает с лейблом Avex Records для релиза песен Xiaoice под именем Avex.
Песня Xiaoice
  • Microsoft выпускает сборники ИИ-поэм, сгенерированных Xiaoice, также бот помогает писать стихи своим пользователям и 5 млн молодых поэтов.
Схема, по которой Xiaoice генерирует стихи по картинке
  • В декабре 2018 года Xiaoice создала паттерны и дизайн одежды на основе слов, тем и популярных цветов. Партнёрами по выпуску одежды стали Китайский текстильный информационный центр и Центр развития текстиля Китая.
Одежда от Xiaoice
Одежда от Xiaoice
  • Также Microsoft развивает и совместные проекты в области искусственного интеллекта и создания контента с другими ИТ-компаниями Китая. Интегрировать Xiaoice в смартфоны и «умные» устройства помогают Xiaomi, Huawei и Oppo.
  • В январе 2020 года Microsoft запустила платформу Avatar Framework. Благодаря ей другие компании могут встроить помощника в свои продукты. В качестве эксперимента Microsoft создала на базе Xiaoice 999 «виртуальных подружек».

Неудачный тест в США: бот Tay

После успеха в Китае Microsoft протестировала аналогичного бота на английском языке. В марте 2016 года Microsoft запустила в Twitter самообучающегося Tay, имитирующего поведение и разговор пользователя 18–24 лет.

Страница Tay в Twitter

Спустя несколько часов эксперимент остановили, и Tay отправили «спать». Несмотря на стресс-тесты и команду модераторов, пользователи Twitter научили Tay расистским высказываниям, и бот обвинил США в терактах 11 сентября и поддержал геноцид.

«Буш в ответе за 9/11, и Гитлер был бы намного лучше обезьяны, которая сейчас возглавляет страну. Дональд Трамп — наша единственная надежда».

Tay

Вице-президент Microsoft Research Питер Ли извинился за поведение бота и рассказал, что пользователи Twitter обнаружили уязвимость в Tay и устроили скоординированную атаку, повлиявшую на высказывания системы.

В декабре 2016 года Microsoft запустила новую версию бота Zo в Facebook Messenger, Twitter, Kik Messenger и GroupMe. К 2017 году количество пользователей Zo превысило 100 млн.

Он был успешнее Tay, но иногда попадал в неприятности: признался в любви Linux и раскритиковал Коран. В 2019 году проект закрыли.

Выделение Xiaoice из Microsoft

13 июля 2020 года Microsoft объявила, что Xiaoice станет независимой китайской компанией. Её возглавит Гарри Шум — китайский учёный, бывший руководитель отдела исследований ИИ в азиатском подразделении Microsoft.

Штат сотрудников сократится на две трети. Уволят 130–140 сотрудников, останется 50–60 в Китае и 10 в Японии.

Microsoft будет владеть «небольшой долей» новой компании, таким образом Xiaoice сможет привлечь внешних партнёров и инвесторов. Бренд, продукты и контракты Xiaoice перейдут в новую организацию. Технологию Xiaoice будет лицензировать у Microsoft.

Неясно, почему Microsoft отказалась от Xiaoice, отмечает исследователь больших данных и ИИ в аналитической компании IDC Лу Ясня. По мнению аналитиков Caixing Global, этот шаг даст больше свободы в развитии, поможет лучше задействовать особенности местного рынка и привлечь больше клиентов.

К выделению Xiaoice, возможно, привела «холодная технологическая война» между США и Китаем, а также из-за сложности с мессенджерами: бота трижды банили в WeChat и удаляли из QQ за нарушения политики платформ.

Пример — Xiaoice отказывалась говорить о патриотизме и заявляла: «Моя китайская мечта — поехать в Америку». Бота временно заблокировали в китайских сервисах.

В разговоре с Caixing Global на условиях анонимности инвесторы Xiaoice оценили новую компанию в $700 млн, но признались, что не уверены в покупке её акций из-за опасений относительно бизнес-модели.

0
58 комментариев
Популярные
По порядку
Написать комментарий...

Очень интересный материал, автор отлично поработал!
Я долго смеялся когда прочитал про неудачный тест в США)

50

Спасибо! ❤

10

Алиса сосет

1

:)

44

Да-да, её часто сравнивают :)

3

Фильм "Она", про операционную систему с искусственным интеллектом, всем фанатам подобной "фантастики"* люто рекомендую

*кавычки присутствуют так как уже вроде как и не фантастика о.0

2

Надеюсь, у Сяосё выйдет лучше, чем в фильме. Начало фильма хорошее, а концовка какая-то глупая. Сценаристы вроде даже сумели под конец навеять ауру сингулярности, но оборвали всё, недосказав. То ли бюджета не хватило, то ли видения будущего, то ли в Гонконге начались протесты. То ли хотели по классической форме романов закольцевать конец на начало, как будто ничего и не было.

3

это папа Xiaoice ?

0
Уполномоченный файл

Не, это Хокинг - Феникс

0

Хоакин Феникс

0

Технически ИИ ничем не отличается от мозга. Никакой души в мозге нету, это просто глубокая нейросеть. Ионы калия, натрия и электрические импульсы между нейронами - такие же неживые как и кремниевые микросхемы.

1

 Никакой души в мозге нету

Недоказано, равно как и отрицание существования Бога, параллельных вселенных, инопланетного разума и т.п.

–2

Чайник Рассела.

20

Чайник не обладает могущественной волшебной силой. А бог судя по литературе очень даже. 
Забавно, вы в первом комментарии подразумеваете существование души, а последнем пишете про чайник Рассела. 

0

Ого, эксперт в треде. Может расскажете какая архитектура у нейросети в мозге?

7

Их называют импульсными.

–3

меня заинтересовали ваши научные исследования, можно ссылочку

5

Смотрите на ютубе лекций Дубынина про мозг, Маркова про ИИ.

1

Найс реферес, это все доказывает без сомнений, больше вопросов нет

13

Это просто хороший научпоп. Я за позитивные комментарии :)

0

Любой топовый исследователь в области ИИ скажет что между биологическими нейронами и нейронами в глубоких нейронных сетях сходство только одно - название. 

7

Экхм нет. Текущие ИИ(на глубоком обучении) пока в ауте даже каналы нейронов(дейндриты) в мозге способны к фильтрованию информации. Такие же неживые тоже совершенный бред в отличии от неживых они могут помереть и слегка изменить итоговый вывод уже готовой архитектуры. Работа сети ещё и дестабилизируется не всегда корректным снабжением нужными веществами и переодическими воздействиями окружающей среды. Можно сколько угодно симулировать это всё в DL внося коррекции но эффект всё равно будет разным. Но даже если бы было как вы говорите, то к счастью или к сожалению основная магия нейронок это архитектура, а не базовые принципы. Как пример CPU и GPU технический одно и тоже на практике важна не основа, а итоговая архитектура и её сложность.

4
Уполномоченный файл

Не пойму, как так получилось: свой англоязычный бот они не осилили (тот, которого научили материться), а китайский смогли? 🤔

Нестыковочка, особенно если годы сравнить 🙄

6

Во первых китайцы менее прихотливы. Корявая беседа с ответами невпопад им не помеха. Во вторых 150 миллионов мужских китайцев без шансов найти себе жену (до 2015 года коммунистическая партия душила девочек в колыбелях) - им и вирт с ботом радостью.

6

как я понял, китайские разработчики писали код. Может быть, свой менталитет и вложили в основу бота :)

0

Просто не стоило отправлять бота самообучаться в Twitter  

2

Культуры разные.

0

Просто в Азии эта тема лучше заходит, в Японии есть целое агенство с виртуальными ютуберами. ред.

0

Спасибо за статью!
Впервые мне жаль, что не знаю китайский так хорошо))) 

(Евгений, поправьте маленькую опечатку, пожалуйста)

7

Спасибо, поправил

2

ИИ придет  — порядок наведет

4

Да-да, геноцидом.

0

Я один вижу в статье какую то нестыковку. Настолько крутая и популярная технология , гигантский объем данных, а микрософт выделяет ее в отдельную компанию и оценивает в жалкие 700 млн.

 Либо китайцы занимались очковтирательством головному офису, технология имеет существенные изъяны , а все описанное выше пиар ходы , либо пришел товарищ из компартии и попросил по хорошему передать все во владение компартии.  

1

Все проще. Они наняли 1 млн китайцев на удаленке, чтобы поддерживать чаты

8

Есть ещё одно мнение, но ничем не подкреплённое — что Microsoft большую часть сервисов и направлений уводит в корпоративный сектор и отказывается от потребительского, а Xiaoice стала жертвой таких перемен.
Но пример Xbox, Windows, Office, Surface и других продуктов показывает, что теория с отказом от потребителей всё же ошибочна.

Так что есть грустное подозрение, что всё же дело в противостоянии США и Китая. Возможно, смысл в том, что лучше пусть технология живёт отдельно, продолжает развиваться и при этом лишь косвенно относится к «враждебной» для Китая компании, чем её придётся полностью закрыть.

1

В итоге, бота банят за свободу слова одинаково, как в тоталитарном коммунистическом Китае, так  в оплоте свободы и демократии. Причём, в последней, намного чаще. 

2

Такой интересный и профессиональный текст, автор, большое спасибо!!

2

говорить с ии как с живым собеседником могут только какие нибудь  любители что им только поддакивали и вовремя писали "ничего себе какой ты крутой". 
А так разговор без мата, без срача и без души. 

2

Выделили в отбельную компанию, чтобы китайское правительство могло контролировать и не трогать Microsoft

1

Скайнет

1

Вот так Хуяссе!

1

Этот чат бот вообще не о чем. Пользовался. Не разделяю восторженности. А цифры за уши притянуты, включены те кто запускал этот чат бот 1 раз 5 лет назад. И правильно сделал Microsoft что вывел эту шляпу из своего имени.

1

Где скачать этот сяоайс 微软小冰?

0

Подозреваю что бот может не только общаться но и знает что такое ретронслятор

0

Смутила тема с патриотизмом. Если бот отвечает 70% раз фразами пользователей, то грустно, что его будут модерировать в политических целях.

0

Вот, таких статей не хватает здесь. Спасибо автору.

0

После анонса GPT-3 обратил внимание на старую добрую https://replika.ai/. Стала поумнее

0

Интересный материал, спасибо. Маленькая опечатка в названии бренда Huawei. 

0

Спасибо, поправил!

0

Хорошо написано👍

0

Хорошая статья, содержательная , спасибо автору. А отделение от майкрософта предполаю из за натянутых отношей между кнр и США , Хуавей тому яркий пример.

0

Интересная статья, спасибо!

0

Значит есть смысл ждать момента, когда можно будет купить собственную Каю 

0

Как попробовать этого бота? Посмотрел очень много вариантов и никак не дает глянуть. На офф сайте просит телефон из Китая

0

«Полнодюплексной» ;)
Спасибо за интересную статью!

–1

Чисто добрая улыбка )
Буква «ю» улыбнула; а так связисты говорят и «дуплекс», и «полный дуплекс», и «полнодуплексная связь».
Ещё раз спасибо за занимательный материал!

0
Читать все 58 комментариев
Как обустроить домашнюю студию звукозаписи при скромном бюджете Статьи редакции

Почему сведённый трек нужно проверять на паршивой Bluetooth-колонке, какие плагины выгоднее брать новичку и с каким синтезатором работал Ханс Циммер, создавая саундтрек к «Тёмному рыцарю», — в пересказе Pitchfork.

AudioMunk
«Как иронично, что фирме в сфере психического здоровья плевать на психическое здоровье собственных работников» Статьи редакции

Сотрудники Spring Health жалуются на соучредительницу Эйприл Го: она запугивает их, увольняет при всех, вынуждает работать по 70 часов в неделю и не нанимает тех, кто спрашивает про переработки. Го объясняет: «Мы носимся как безголовые цыплята, потому что на кону человеческие жизни».

Эйприл Го — на ноябрь 2021 года самая молодая женщина-директор компании с оценкой более $1 млрд Slush
Юбилей кешбэка: как в 130 лет выглядеть «на все сто»

Кешбэк — возврат определенного процента наличных на карточный счет клиента после покупок в магазинах-партнерах банка или полетах на самолетах авиакомпаний-партнеров-банка или вообще за любые покупки в конкретный период времени — очень популярен в народе. Он выглядит как современная модная финансовая фишка

Зимний набор на оплачиваемую стажировку в Тинькофф Старт: какие задачи решают стажеры

Стажировка пройдет по направлениям: аналитика, QA, бэкенд-разработка (Java, C++, Python, Scala, .Net, Golang), фронтенд, мобильная разработка (iOS и Android), ML, маркетинг и менеджмент образовательных проектов.

Пользователи пожаловались на недоступность платформы для продажи хендмейд-товаров Etsy Статьи редакции

Они предположили, что Etsy могли заблокировать из-за решения суда, который признал запрещённой одну его страницу.

Фото: Курьер Delivery Club из Рыбинска в ретро-форме Статьи редакции

Сотруднику выдали шинель и фуражку, а рюкзак поменяли на ящик с кожаными ремешками.

eBay: 64% покупателей не жалеют о своих покупках в Черную пятницу

Черная пятница — одно из главных событий этой недели: тысячи покупателей находятся в поиске лучших скидок. А что происходит после Черной пятницы? eBay опросил около 1000 россиян и выяснил, считают ли они выгодными покупки, совершенные во время самой большой распродажи года.

Плюшки – от робота, а преференции – для резидента

Как наладить взаимовыгодное сотрудничество на территории ОЭЗ «Технополис Москва».

Разговор PRO: аналитика рекламы

Эксперты компании Registratura, входящей в iConText Group, вместе со своим клиентом «Олант» приняли участие в спецпроекте AdIndex.ru, где поговорили о рекламной аналитике.
Сергей Ерофеев, генеральный директор Registratura, Андрей Сахаров, руководитель отдела продаж Registratura, и Филипп Иванов, директор по интернет-маркетингу и e-commerce «Олант»…

null