{"id":14290,"url":"\/distributions\/14290\/click?bit=1&hash=bece6ae8cf715298895ba844b6416416882fe02c5d18dab2837319deacd2c478","title":"\u041a\u043e\u0440\u043f\u043e\u0440\u0430\u0446\u0438\u0438 \u043a\u0430\u043a \u043d\u0438\u043a\u043e\u0433\u0434\u0430 \u0440\u0430\u043d\u044c\u0448\u0435 \u0445\u043e\u0442\u044f\u0442 \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u0447\u0430\u0442\u044c \u0441 \u043c\u0430\u043b\u044b\u043c \u0431\u0438\u0437\u043d\u0435\u0441\u043e\u043c","buttonText":"","imageUuid":""}

За 2 недели разработал аналог робота от «Гугла», которого создавал целый штат разработчиков несколько лет

Меня зовут Александр Зайцев, и я сооснователь компании Dasha.ai — это неотличимый от человека ИИ для разработчиков и бизнеса. С помощью платформы можно создавать умные голосовые модели для колл-центра, сайта или мобильного приложения.

Послушайте, как Даша говорит, ее не отличить от живого человека.

Даша может предложить дополнительную услугу, собрать обратную связь и перезвонить позже, если человеку неудобно разговаривать

В 2018 году я увидел презентацию Google Duplex — робота, который может сам забронировать столик в ресторане. Над созданием этой технологии в Гугле работал целый штат разработчиков в течение пары лет.

Мне захотелось повторить такой эксперимент с Дашей и посмотреть, что у меня получится.

Сейчас расскажу, как вышло так, что я сделал Дашу быстрее и лучше, чем Duplex от Гугла.

Решил скопировать сервис Гугла, чтобы узнать, на что способна моя разработка

Когда я услышал о Google Duplex, Даша еще была кастомным решением для конкретной задачи: умела только звонить дилерам и предлагать сотрудничество. Но уже тогда это была инновационная идея — первая разработка, которая проходила тест Тьюринга: человек не понимал, что общается с роботом.

В планах было разработать полноценную платформу для создания голосовых моделей со своим языком программирования, сервисами для синтеза и распознавания речи, диалоговым движком, нейронными сетями для извлечения смысла сказанного.

Вот как звучал наш собственный первый синтез речи — немного неестественно и рвано:

Когда в январе 2021 с командой запустили первую версию платформы, на которой уже можно было создавать голосовые модели, я захотел повторить эксперимент Гугла. И за две недели написал модель бронирования столиков в ресторанах.

Потом я узнал от одного из сотрудников Google, что над разработкой Duplex работало 60 разработчиков в течение двух лет.

Как повторял эксперимент в США

Для чистоты эксперимента я решил тестировать Дашу в реальных условиях: звонить в действующие рестораны и бронировать столики. Да простят нас все, к кому не пришли на ужин ¯\_(ツ)_/¯

С сайта yelp.com я парсил открытые данные: номера телефонов ресторанов США, Великобритании и Австралии — стран, где говорят на английском, но с разным акцентом. Хотел усложнить Даше задачу, чтобы посмотреть, как она будет понимать людей, которые говорят не всегда четко и понятно, а также используют разные речевые обороты.

Даша успешно провела 93% звонков, а Гугл — 60%

Даша успешно провела 93% звонков. Результат разговора считался успешным, если диалог закончился согласно скрипту: робот мог что-то не понять с первого раза, но в итоге корректно завершил разговор.

Пример разговора, где Даша сначала не поняла, что у нее спрашивает менеджер, но все же успешно завершает разговор:

Вот один из промежуточных результатов прозвона: всего Даша дозвонилась в 23 ресторана:

  • 7 разговоров закончились тем, что рестораны не бронируют столики;
  • 1 разговор шел нормально, но внезапно прервался;
  • 4 человека без видимой причины перестали отвечать;
  • 4 пустых звонка, когда трубку сняли, но ничего не сказали;
  • 2 разговора с ошибками, когда Даша сказала что-то не то и разговор закончился неуспешно;
  • 3 успешных бронирования;
  • 2 неверно набранных номера, когда Даша попали не в ресторан, а в другие организации.

В конце второй недели доработки модели, Даша в выборке из 50 разговоров успешно проводила диалог в 93% разговоров. Google Duplex на момент релиза успешно завершал всего 60% разговоров, остальные переадресовывал на живого человека. В 2021 году Google Duplex уже успешно проводил 80% звонков.

Добиться 80% успешных диалогов намного проще, чем 90+ %.

Разница в 13% кажется небольшой, но для голосового робота — это огромный отрыв. За каждым процентом стоит сложная разработка диалогов и тысячи тестовых разговоров.

За пару доработок можно сделать робота, который будет проводить 50% успешных разговоров. Для этого достаточно использовать ключевые слова.

Чтобы достичь результата в 70% успешных разговоров, нужно добавлять минус слова.

Чтобы достичь 90% успешных разговоров, нужны нейросети для извлечения смысла сказанного и долгие совершенствования на реальных разговорах.

Чтобы робот заканчивал 95% успешных диалогов, нужно провести 600 разговоров и протестировать редкоиспользуемые ветки разговора.

Для результата в 98% необходимо провести несколько тысяч разговоров, разработать и протестировать очень редкие ветки диалога, тщательно разбивать запросы на смыслы и работать над формулировками робота.

Как нам удалось побить результат Гугла

Во время проведения эксперимента я столкнулся с тем, что иногда вместо менеджера на звонок отвечает автоответчик, не все сотрудники ресторанов спрашивают детальную информацию о заказе и иногда приходится брать разговор в свои руки.

Научил определять автоответчики

Даша должна была научиться определять автоответчик и не разговаривать с ним. Проблема была в том, что Даша ориентируется по смыслу сказанного, а в США на автоответчики часто записывают произвольную речь, поэтому нельзя было опираться на извлечение смысла из фраз, потому что он всегда разный.

Проблему удалось решить только путем от обратного: я считал за робота любого, кто не «доказывал», что он человек. Например, я заметил, что люди почти всегда говорят «good morning/day/afternoon» или «how may i help you», поэтому я создал запрос — определенные смыслы фраз, которые гарантировали, что говорит человек. Это почти решило проблему.

Еще оставались случаи, когда трубку снимал человек, но вел себя необычно, например просто говорил «Hello». Тогда Даша начинала разговор с приветствия и ждала подтверждения, что это человек. Таким образом мне удалось примерно с 99% вероятностью правильно определять автоответчики.

В начале разговора Даша пытается определить автоответчик. Когда понимает, что это человек, то продолжает разговор и успешно его завершает:

Научил инициировать разговор

Бывали случаи, когда менеджеры ресторанов на вопрос Даши «Hello! Can i book a table for today?» отвечали «okay» вместо ожидаемого вопроса о времени бронирования или количестве персон.

Пришлось сделать так, чтобы Даша в таких случаях сама вела диалог дальше. Иногда доходило до смешного.

Даше пришлось самостоятельно уточнять всю информацию о бронировании столика

Научил вести нелинейный разговор

В процессе разработки модели я столкнулся с тем, что люди могут внезапно попросить повторить информацию, сказанную ранее — имя, номер телефона, время бронирования. Сначала я попытался решить эту проблему самым простым путем — признаваться, что Даша робот. Я подозревал, что эта плохая идея, но даже Гугл в своей рекламе показывал, что Duplex в начале звонка говорит, что он робот. Когда я попробовал сделать так же, 90% людей просто бросали трубку.

Тогда пришлось прибегнуть к нелинейной модели разговора — это когда разговор может вернуться к предыдущей точке. Я создал модель, в которой реплики связаны не переходами, а правилами. Даше нужно только правильно понять смысл сказанного, и уже не важно, в каком месте разговора это произойдет.

Каждый может создать себе голосового ассистента на платформе Dasha.ai

Я понял, что Даша — это очень перспективная разработка. Потому что на платформе есть весь функционал для создания разговорных моделей на любые темы без использования сторонних сервисов.

В январе 2021 года мы запустили закрытое бета-тестирование нашей платформы Dasha.ai для быстрой и легкой разработки голосовых моделей и чат-ботов. Каждый желающий может скачать приложение, получить API-ключ от платформы и написать разговорную модель для телефонного разговора или управления «умным» прибором с микрофоном и доступом в интернет.

Технология адаптируется под любую задачу, для которой можно написать скрипт: опросы, прозвон клиентов, проверка актуальности заявок, обзвон кандидатов на работу.

Вы сами можете повторить эксперимент с бронированием столиков.


Я выложил исходный код модели в репозиторий на GitHub. Теперь каждый может запустить приложение и посмотреть как работает разговорный робот. Инструкция по запуску — в файле «README.md». Если будут вопросы по запуску, пишите в комментариях или в личные сообщения.

0
170 комментариев
Написать комментарий...
second avenger

Я за 2 недели разработал аналог Spacex, который создавал целый штат разработчиков несколько лет. Хули нам )

Ответить
Развернуть ветку
Indig0
Ответить
Развернуть ветку
1 комментарий
Кружочек

Я за 2 недели изобрёл способ съесть шаурму не пролив соус. 

Ответить
Развернуть ветку
5 комментариев
Alexander Zaytcev
Автор

я б почитал)

Ответить
Развернуть ветку
1 комментарий
Kondin Dmitriy

Ну да, ну да, за две недели )
Подключить в питоне тензор-флоу и несколько либ с гитхаба, которые ваяли гугл несколько лет.
Называется "стоя на плечах гигантов" делаю громкие заявления.

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

у нас платформа, на ней можно создавать разные голосовые модели. Модель в этой статье - лишь частный пример.
На платформе у нас полностью свои сервисы распознавания, синтеза речи, выделения посыла из фразы пользователя, диалоговый движок (исключая русский синтез речи, английский - наша разработка)

а вот "стоя на плечах гигантов" полностью согласен, но все мы на них стоим. Например я печатаю с ноутбука, в котором куча технологий, для создания которых потребовались тысячи открытий в прошлом

Ответить
Развернуть ветку
17 комментариев
Маратка Тотсамый

А ещё, данная фича интегрирована в смартфоны от Гугла, и там эта фишка прикольная, но увы, не работает в России

А ещё у Гугла, эта фишка удобна тем, что звонок можно вести с помощью чата, например упрощает жизнь глухих людей,

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Родион Проскуряков

Статья интересная, но заголовок, к сожалению, кликбейтный. Во-первых, явно описываемая система разрабатывалась и тестировалась не за две недели. А во-вторых, стоит учитывать, что когда Гугл начинал разработку дуплекса, открытых технологий и моделей, инструментов, было меньше. Это как запускать сейчас BERT на старых NLP-соревнованиях и хвастаться тем, что он значительно побил лучший результат на момент проведения соревнования.

Ответить
Развернуть ветку
Stas Klymenko

"За 2 недели"
У вас репозитории редактируются уже почти год. Исходный код лежит с конца 2020 года. Можно узнать, что заложено в понятие 2 недели? 
—-
"Когда в январе 2021 с командой запустили первую версию платформы"
Тогда она уже была в разработке минимум 4 месяца. 
—-
"Меня зовут Александр Зайцев, и я сооснователь компании Dasha.ai"

Не могу понять. На сайте вас нет в списке разработчиков. На GitHub в основном контрибьютили 3 человека: Vlad Chernyshov, Ilia Pozdnyakov, Andrey Chernykh. 
Во-первых, эту Дашу очевидно разрабатывал не один человек, тоже штат, хоть и не очень большой (У Google, к слову, тоже такие команды есть, не удивлюсь, если их штат был таким же, как и ваш в рамках Duplex). 
Вместе с вами штат разработки уже минимум 4 человека.
—-
- разговор шел нормально, но внезапно прервался;
- человека без видимой причины перестали отвечать;
- пустых звонка, когда трубку сняли, но ничего не сказали;
- разговора с ошибками, когда Даша сказала что-то не то и разговор закончился неуспешно;
- 2 неверно набранных номера, когда Даша попали не в ресторан, а в другие организации.

В какую категорию вы относите эти звонки? Все они, потенциально, могли закончиться или закончились неудачно. 
В выборке из 23 прозвонов я вижу только 10, которые наверняка можно назвать удачными: когда ресторан не бронировали и когда он успешно был забронирован. Остальные случаи нельзя учитывать в статистике "успешные/не успешные", поскольку их исход неизвестен. 
—-
" Dasha.ai — это неотличимый от человека ИИ для разработчиков и бизнеса." 
Даже при 93% это неверное утверждение. Пока из ваших же тестов увидел результат ниже 50%, что очевидно не соответствует утверждению. 

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

"У вас репозитории редактируются уже почти год." - если я вас правильно понял, то вы смотрите на https://github.com/orgs/dasha-samples/repositories - там много моделей, есть старые, которые действительно созданы что то около середины 2020 года, тогда платформа еще не была "запущена"  для сторонних разработчиков.

"Тогда она уже была в разработке минимум 4 месяца."  первые модули платформы начали разрабатывать еще в 2018 году.

"Вместе с вами штат разработки уже минимум 4 человека." - я  сооснователь компании, но не разработчик. Поэтому не являюсь создателем платформы, которую писали  около 25 инженеров с 2018 по текущее время. Вообще, это отдельная большая история, может статью и об этом напишу, если интересно.
"Пока из ваших же тестов увидел результат ниже 50%" это один из промежуточных результатов, не конечный.

"Даже при 93% это неверное утверждение." - строго говоря, даже при 100% это не так, потому что стоит немного отклониться от темы и робот не сможет обработать вопрос корректно. Тут смотря что закладывать.

Вообще, вы задаете интересные вопросы,  я могу написать отдельные статьи на некоторые из вопросов (потому что развернутый ответ можно написать как отдельную увлекательную историю на пару страниц)

Ответить
Развернуть ветку
6 комментариев
Warm August

С массовым введением роботов качество работы call-центров стало ниже плинтуса. В итоге постоянно пытаешься добиться чтобы соединили с оператором. При этом роботы постоянно тебя не понимают, но упорно не хотят соединять с человеком, и рассчитаны похоже на разговор с таким же роботом. Эти роботы прогресс из разряда победы пласстмассового мира. 

Ответить
Развернуть ветку
Mr. Z

Лет 10-15 один наш клиент, очень большой банк, получил приз "Колл-центр года" или что-то около того, где одним из критериев, по сути, была просто невозможность в голосовом меню найти человека.
Клиенты это решение ненавидели, но экономически это была просто бомба.
Банк сидел на корпоративных клиентах и видимо особо от неудобства их сотрудников не страдал.

Ответить
Развернуть ветку
Александр Александров

тут надо быть умнее и быстрее выходить на диалог с оператором.

Ответить
Развернуть ветку
3 комментария
Alexander Zaytcev
Автор

вы правы, сейчас основная проблема роботов в том, что они "тупые". Мы стараемся сделать так, чтобы проще было создавать ботов, которые не вызывают раздражение своей непонятливостью. Но конечно в итоге всё зависит от автора голосовой модели

Ответить
Развернуть ветку
Слава Коженевский

Ну есть одно ощутимое но,  при сравнении с Гуглом ... Там она работает как секретарша, а здесь тупой скрипт — даже для записи в парикмахерскую не подойдёт , тупо для холодных звонков. 
И интересно сколько будет "слитых" клиентов, которые даже не будут слушать, услышав нотки робо-голоса. 
Очередная бессмысленная звонилка, которая лишь приближает к полной отмене телефонных разговоров. И выкачивает денежки из наивных дурачков, которые думают, что робот сможет заменить холодные звонки. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
2 комментария
Ренат Ренатович
И выкачивает денежки из наивных дурачков, которые думают, что робот сможет заменить холодные звонки.

Дурачки обычно пытаются сопротивляться прогрессу) Если уж просто записанный по скрипту голос позволяет быстро и дешево прозвонить несколько тысяч человек и собрать нужные данные, то что говорить про подобные голосовые модели.
И да - робот вполне себе может заменить холодные звонки, там вовсе не нужно блистать остроумием и большим кругозором.

Ответить
Развернуть ветку
8 комментариев
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Артём Палённый

уже давно общаются, если у тебя стоит бот-секретарь.

Ответить
Развернуть ветку
Vladimir Petrov

Мне в корпоративный аккаунт иногда пишут чат-боты и общаются там с моим чат-ботом. Я потом читаю и смеюсь над ними.

Ответить
Развернуть ветку
1 комментарий
Денис Мамаев

Когда звонят не-пойми-кто сразу спрашиваю то, чего не ждут. Робот палится "моя твоя не понимай", т.к. в скрипте нет такого смысла.
- Я из соцопроса.
- Вопросы веселые?

Голос а-ля секс по телефону - тоже робот. Досвидос.

Ответить
Развернуть ветку
Pavel Loginov

У меня бывшая таким голосом говорила... первые пару месяцев...

Ответить
Развернуть ветку
4 комментария
Сергей Хапалов

А что, секс по телефону по подписке🙂

Ответить
Развернуть ветку
Yuri Kagan

Супер)

Ответить
Развернуть ветку
kitty_bot
Даша успешно провела 93% звонков, а Гугл — 60%
Я подозревал, что эта плохая идея, но даже Гугл в своей рекламе показывал, что Duplex в начале звонка говорит, что он робот. Когда я попробовал сделать так же, 90% людей просто бросали трубку.

эээ, где тут побитый результат гугл? у гугла 60% успех, у даши менее 10% при равных условиях

ну и главное - гугл то два года инструменты в основном разрабатывал не писал скрипты для готовых решений

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

гугл пишет, что 60% разговоров робот провёл без помощи оператора, а сколько  сколько из них не состоялось, когда робот сказал, что он робот - такой статистики нет. Скорее всего те-же 90% брошенных трубок

Ответить
Развернуть ветку
Alexey Ivanov

После заголовка можно не читать.

Ответить
Развернуть ветку
Masha Kovalyova

Dasha.ai - это примерно как парикмахерская "Светлана"

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

насчет заголовков - я много раз видел на VC хорошие, вычитанные статьи, в которых точно и по делу пишется о чем-либо. Только у них просмотры почти отсутствуют, как и комментарии. Людям в массе это скучно читать, увы.

Ответить
Развернуть ветку
2 комментария
Андрей Шмиг
которая проходила тест Тьюринга: человек не понимал, что общается с роботом.

Вы себе как-то неправильно тест Тьюринга представляете.

Банально из Википедия: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».

Банально рассмотреть в скрипте все ветки не значит, что машина прошла тест Тьюринга. Сколько я платформ не видел и со сколькими не работал - ЦРТ, АСМ (модели, синтез), МАИКС и прочие везде и всегда комплексные проблемы - (а) нестандартные вопросы (б) излишняя связность между блоками в скрипте и (в) полный провал при длительных диалогах (в частности - опросные / маркетинговые направления).

Работает +- нормально только на коротких диалогах и для классификации / категоризации обращений.

Ответить
Развернуть ветку
Shepard

Разработчик спам бота, очень интересно

Ответить
Развернуть ветку
Konstantin T.

Расскажите пожалуйста где тут ai (ну, кроме распознавания речи), скрипты же. И комментариев нет совсем в коде. 

Ответить
Развернуть ветку
Pavel Loginov

Вы токсичный чел, занимающийся обесцениванием

Ответить
Развернуть ветку
Anton Z.

да и распознавание речи нихрена ни разу не ai, ml

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

смотря, что вы вкладываете в это понятие. На мой взгляд ИИ это даже не нейронки, а что то более сложное. В статье понятие используется скорее как хайповое слово, под которым подразумевают нечто "умное"
Как сказал наш главный научный сотрудник "Главная проблема ИИ в том, что когда его сделают, его перестают считать ИИ"

Ответить
Развернуть ветку
1 комментарий
Ivan Rubtsov

Не давайте Дашу коллцентрам банков

Ответить
Развернуть ветку
Dmitriy Ukhin

Цитата из Ютуб канала научпопа: "люди десятилетиями пытались понять работу фотосинтеза, а я вам все объяснил за 5 минут. Лол"

Типичный рекламный вброс. Работал я в стартапе подобного направления. Турецкий продукт Sestek, ссал в уши про 93% распознавание речи и синтезом на соточку. По факту не вытянул даже 40% на деле и заказчик такого продукта быстро закрыл лавочку. Хотя презентация была на уровне : 😏

Ответить
Развернуть ветку
Nick Chernykh

Турки без ссанья в уши не проживут и дня. Пока есть глюпай Наташа, живьется харашо   

Ответить
Развернуть ветку
Олег Чеботарев

Телефонные роботы - самое омерзительное, что случилось с телефонами за сто лет существования телефонов

Ответить
Развернуть ветку
Роман Рабочий

Классическая телефония обязана умереть в текущем её виде.
Иначе бесконечная гонка вооружений между роботами спамерами и "защитниками" не закончится никогда.
Я пошел писать статью на эту тему и пилить новый стартап ) 

Ответить
Развернуть ветку
Pavel Loginov

Не могу с вами согласиться, Роман. Голос — самый удобный и универсальный интерфейс с тысячелетней историей. Просто роботы еще не доросли до уровня даже глупого человека, потому люди и избегают их (по той же причине почему мы избегаем разговоров с бестолковыми людьми). Придёт время и говорить с роботом будет интереснее и продуктивнее, чем со средним человеком

Ответить
Развернуть ветку
3 комментария
Alexander Zaytcev
Автор

ничто не вечно) но голосовой ИИ это всего лишь инструмент и как любой инструмент, его можно использовать как во благо, так и во вред. 
Чтобы во вред его использовать было нельзя, нужны защитные механизмы, которые также должны появиться

Ответить
Развернуть ветку
kuskus kuskus

Интонирование у неё отличное, на мой вкус конечно. Мин обороне нужно продавать для секса по телефону для солдат)) 

Ответить
Развернуть ветку
pongo

Кликбейтный заголовок и тон статьи подрывает доверие к вашей, по видимому, неплохой разработке. Я сперва подумал, из-за заголовка, что вы просто взяли наработки гугла, выдав их за собственные.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Alexey Kott

Когда гугл сделал кучу RnD-работы и выложил в опенсурс, а потом крутой хакер Вася пришёл, допилил немного под свои нужды и теперь говорит, что он один превзошёл всю компанию. Ну-ну.

Ответить
Развернуть ветку
Alexander Plyonkin

Ещё один бот-звонилка для впаривания всякой фигни. Из-за таких как вы я больше не беру трубку с левых номеров

Ответить
Развернуть ветку
Zoringer

помню, еще в советские времена, бабушка решила заказать мне билеты на поезд по телефону и после слов "с вами говорит робот-автоответчик...", она такая:
- Роберт? Подожди Роберт...

Ответить
Развернуть ветку
Владимир AngryCEO

Выаши 93% на основе выборки в 50 звонков, а у Гугла 80% на какой выборке получилось? Без такого сравнения выводы делать как минимум некорректно, не говоря уже о триггере соединения с оператором, которого у вас нет, а вы просто ждёте когда закончится разговор, а Гугла какой-то все же есть.

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

Про выборку Гугла мне к сожалению не известно, но я понимаю, что чем больше выборка, тем точнее процент. Но в любом случае, не думаю, что на выборке в 500 разговоров ситуация будет серьезно отличаться. Я же звонил партиями и на каждой партии был виден прогресс, последняя партия и показала 93%, до этого чуть меньше, с ходу не скажу, не помню.

Ответить
Развернуть ветку
Андрей Чураев

А может это такой план, вбросить очевидный кликбейт что бы получить максимум коментов и откликов, а мы ведёмся?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

могла звонить, да)
у нас есть клиент с таким кейсом

Ответить
Развернуть ветку
2 комментария
Nick Chernykh

Александр, а инвестор ваш, разве не помогает с выходом на рынок? Зачем эта статья на vc? У вас там серьёзные люди) дали денег)

Ответить
Развернуть ветку
Роман Милованов

сфокусировались на США, но не пошло видимо. Пришлось возвращаться в РФ, там еще есть история с основателями, до данного проекта.

Ответить
Развернуть ветку
3 комментария
kav

Кажется весь мир идет к тому что звонки будут отмирать в пользу чатов и смс, большинство людей на свете не любит звонить кому-то или отвечать на незнакомые номера)

Ответить
Развернуть ветку
Panzer Kaiser

1) Зачем такой хайповый заголовок? 
2) общался я с разными роботами. Беглую речь они ни на одном языке не понимают. Слэнг тем более. Как с дурачками надо разговаривать. Основная проблема, что носители одного и того же языка с разных мест планеты друг друга не понимают. Куда там роботам

Ответить
Развернуть ветку
John K

Пользуюсь Дусей уже больше 8 лет. Прописал все макросы и не знаю бед.

Ответить
Развернуть ветку
Pavel Loginov

Да в том и дело, что АИ особо то и нет, везде тупой мэтчинг

Ответить
Развернуть ветку
1 комментарий
Пользователь VC

Автор красава - всегда можно сделать чтото лучше, и логотип гугла ещё не залог высшего качества, так как там работают такие же люди как и мы. Но вот насчёт 2 недель я может чего то не понял - ты с нуля всё делал, или же взял их наработки и доделал до своего проекта?

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

с нуля писал голосовую модель на базе платформы

Ответить
Развернуть ветку
1 комментарий

Комментарий удален модератором

Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

что вы имеете ввиду?

Ответить
Развернуть ветку
2 комментария
Yaroslav Tugolukovskiy

Александр, судя по первому видео на вашем сайте, стричься вы будете весь четверг с утра до самого вечера. Интересная парикмахерская, конечно. 

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

в рамках демки действительно нет выбора времени. Задача была показать, что бот может следовать по нелинейному диалогу.
На самом деле, эта демка не годится для реального использования, там нет ни интеграции с БД, ни выбора времени, типа стрижки, мастера и прочее

Ответить
Развернуть ветку
2 комментария
Павел Молянов

Круто говорит, действительно на живого человека похоже

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

то, что говориться на русском - это не синтез, это предзаписанные фразы человека. Синтез на англ языке. На всякий случай решил напомнить)

Ответить
Развернуть ветку
1 комментарий
Андрей Чураев

Нужно смотреть что внутри у Даши. Обычно оказывается куча фреймворков и библиотек которые и создавали команды из гугла, но я ни чего не утверждаю

Ответить
Развернуть ветку
Игорь Сазонов

Подозреваю, что не за горами время, когда напишут ботов для разговоров с этими Дашами. С Плеймаркета в каждом телефоне.... 

Ответить
Развернуть ветку
Павел Переверзев

Чет я не понимаю, это разве настолько долго и неудобно нынче звонить и бронировать столик? Мне порой кажется, что компании и отдельные разрабы уже от кризиса идей начинают доить технологии по максимуму, выдавая продукт с уж очень специфическим функционалом. 
В любом случае, я бы не стал доверять никаким цифровым помощникам в выборе ресторана и бронировать места, не узнав заранее о возможных депозитах и столиках с наиболее комфортным расположением. 
Напишите бота, который будет красиво отвечать на комментарии на виси)

Ответить
Развернуть ветку
Дмитрий ХХХ

Я за пол дня пиз.. ь научился, лучше, чем Путин, почему я не президент

Ответить
Развернуть ветку
R.K. Sarov

А голос приятный. Вы бы что ли большим компаниям типа МТС или Сбер предложили свои услуги. А то у лидеров ИТ отрасли России головые помощники все как на подбор с неприятными голосами и соображаловкой

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

они хотят, чтобы решение было полностью внутри их инфраструктуры + предлагают цены, которые находятся на границе себестоимости. Думаю, в будущем, если мы как компания будем развиваться правильно, всё будет.

Ответить
Развернуть ветку
Павел Губанов

Молодцы, желаю успехов! Я занимаюсь CRM уже много лет, хорошей технологии в этом сегменте как раз не хватает.

Ответить
Развернуть ветку
Alex Yanshin

Очень Круто страховки допродаёт.
Прям рывок в AI
Правда мне пока Даша не звонила)

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

дело не в том, что она круто допродаёт, а в том, что стало проще теперь ботов создавать: на платформе всё для этого есть. Единственный минус - надо знать java script как минимум

Ответить
Развернуть ветку
1 комментарий
Sergey Krupskiy

Если все действительно выглядит так, то просто отлично. Попробую ваше api потыкать.

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

отправьте нам запрос через обратную форму

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Андрей Семенов
Ответить
Развернуть ветку
Невероятный Блондин

Хм, где-то я уже слышал этот диалог с полисом осаго пару лет назад.
Ещё тогда помню отметил секси голос.

А вот английский голос какой-то совсем всратый 

Ответить
Развернуть ветку
33_rublya

Просто ппц

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Кружочек

И я

Ответить
Развернуть ветку
Vladimir Petrov

Вот кто мне звонит каждый час!

Ответить
Развернуть ветку
Вадим Клюев

есть много разработок получше, чем известные и адвно раскрученные, но им не дадут продвигаться те, кто поставляет разную фигню от корпоративных разработчиков, способных затоптать конкурентов

Ответить
Развернуть ветку
pongo

Приведите несколько примеров.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
xsend24 Ru

Интересно было почитать

Ответить
Развернуть ветку
Лёва Суходольский

Задумка интересная и надо сказать реализация оч достойная. Дерзайте!

Ответить
Развернуть ветку
Андрей Чуринов

Тест Тьюринга все же предполагает, что человек в курсе происходящего и перед ним стоит задача отличить бота от человека.

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

Есть много вариаций теста Тьюринга https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82_%D0%A2%D1%8C%D1%8E%D1%80%D0%B8%D0%BD%D0%B3%D0%B0#%D0%92%D0%B0%D1%80%D0%B8%D0%B0%D0%BD%D1%82%D1%8B_%D1%82%D0%B5%D1%81%D1%82%D0%B0_%D0%A2%D1%8C%D1%8E%D1%80%D0%B8%D0%BD%D0%B3%D0%B0
мы под таким, ограниченным тестом Тьюринга имеем ввиду, что ничего не подозревающий человек за время разговора с роботом не должен понять, что говорит с ботом

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Влад Иваненко

Видел обзор - реально впечатляет. Трудно поверить что за две недели такое можно было запилить

Ответить
Развернуть ветку
Никифор Серяков

Гугл делает систему, которая понимает в диалог (откуда и название), опираясь на предыдущие разработки синтеза и распознания речи.

А вы сделали набор скриптов для спам бота.

Что общего у этих двух систем? Где тут AI? Как их вообще можно сравнивать?

Понятно, вы хотели ажиотажа, но зачем подменять понятия и вводить в заблуждение, репутация же важна, или нет?

Почитайте Максима Ильяхова, он научит писать правду.

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

Спасибо, но я умею писать правду и без Ильяхова)
Кстати, а что вы подразумеваете под словом "понимает"?

Ответить
Развернуть ветку
Oko Lenmi

"4 человека без видимой причины перестали отвечать"
Побежали прятаться в бункере от роботов.

Ответить
Развернуть ветку
Dmitry Kuteiko

Убейтесь все вместе со своими роботами. Задолбало через них пробиваться к людям! 

Ответить
Развернуть ветку
Дмитрий Уваров

Не понимаю почему столько негатива. Ну есть сервис для генерации голосового помошника. Плати и получай новый экспириенс от своего приложения. Главное чтобы сырым это не было. Я с Виктором Осетровым из realspeaker знаком. Он 7 лет толкового распознавания по исходному аудиофайлу не смог добиться. 

Ответить
Развернуть ветку
Игорь Корнев

Для аренды жилья посуточно пригодилось бы, чтобы вместо меня это делала дашка). Тут правда много нюансов.. какая кв., на какой день, время, сколько лет, сколько человек, бронь.

Ответить
Развернуть ветку
Alexander Zaytcev
Автор

нуу, все можно сделать. Только для аренды жилья - на это есть airbnb, booking и т.п. Там уже все и так вроде отлажено.
Имею в виду, что не все задачи оптимально решать через голосовое общение

Ответить
Развернуть ветку
Нина Прохорова

День добрый! Заинтересовало, спасибо за ссылку на тестовую версию

Ответить
Развернуть ветку
Иван Ревин

Ну гуд, что сказать. Перспектива для проекта хорошая как мне кажется, спрос на подобные модели программ сейчас высокий.

Ответить
Развернуть ветку
Сергей Харитонов

Не то чтобы идея новая, но исполнение реально достойно респекта на мой взгляд. 

Ответить
Развернуть ветку
Роман Полтавский

Скорее за две недели довел до ума, как я понял из написанного база-то какая-то на тот момент уже была. В любом случае недурно, даже очень.

Ответить
Развернуть ветку
Евгений Алашеев

Писал вам в поддержку. Хотел сделать обзвонщика и за 2 года мне так и не ответили 🤣. Крутой проект, что могу сказать

Ответить
Развернуть ветку
167 комментариев
Раскрывать всегда