За 2 недели разработал аналог робота от «Гугла», которого создавал целый штат разработчиков несколько лет
Меня зовут Александр Зайцев, и я сооснователь компании Dasha.ai — это неотличимый от человека ИИ для разработчиков и бизнеса. С помощью платформы можно создавать умные голосовые модели для колл-центра, сайта или мобильного приложения.
Послушайте, как Даша говорит, ее не отличить от живого человека.
В 2018 году я увидел презентацию Google Duplex — робота, который может сам забронировать столик в ресторане. Над созданием этой технологии в Гугле работал целый штат разработчиков в течение пары лет.
Мне захотелось повторить такой эксперимент с Дашей и посмотреть, что у меня получится.
Сейчас расскажу, как вышло так, что я сделал Дашу быстрее и лучше, чем Duplex от Гугла.
Решил скопировать сервис Гугла, чтобы узнать, на что способна моя разработка
Когда я услышал о Google Duplex, Даша еще была кастомным решением для конкретной задачи: умела только звонить дилерам и предлагать сотрудничество. Но уже тогда это была инновационная идея — первая разработка, которая проходила тест Тьюринга: человек не понимал, что общается с роботом.
В планах было разработать полноценную платформу для создания голосовых моделей со своим языком программирования, сервисами для синтеза и распознавания речи, диалоговым движком, нейронными сетями для извлечения смысла сказанного.
Вот как звучал наш собственный первый синтез речи — немного неестественно и рвано:
Когда в январе 2021 с командой запустили первую версию платформы, на которой уже можно было создавать голосовые модели, я захотел повторить эксперимент Гугла. И за две недели написал модель бронирования столиков в ресторанах.
Потом я узнал от одного из сотрудников Google, что над разработкой Duplex работало 60 разработчиков в течение двух лет.
Как повторял эксперимент в США
Для чистоты эксперимента я решил тестировать Дашу в реальных условиях: звонить в действующие рестораны и бронировать столики. Да простят нас все, к кому не пришли на ужин ¯\_(ツ)_/¯
С сайта yelp.com я парсил открытые данные: номера телефонов ресторанов США, Великобритании и Австралии — стран, где говорят на английском, но с разным акцентом. Хотел усложнить Даше задачу, чтобы посмотреть, как она будет понимать людей, которые говорят не всегда четко и понятно, а также используют разные речевые обороты.
Даша успешно провела 93% звонков, а Гугл — 60%
Даша успешно провела 93% звонков. Результат разговора считался успешным, если диалог закончился согласно скрипту: робот мог что-то не понять с первого раза, но в итоге корректно завершил разговор.
Пример разговора, где Даша сначала не поняла, что у нее спрашивает менеджер, но все же успешно завершает разговор:
Вот один из промежуточных результатов прозвона: всего Даша дозвонилась в 23 ресторана:
- 7 разговоров закончились тем, что рестораны не бронируют столики;
- 1 разговор шел нормально, но внезапно прервался;
- 4 человека без видимой причины перестали отвечать;
- 4 пустых звонка, когда трубку сняли, но ничего не сказали;
- 2 разговора с ошибками, когда Даша сказала что-то не то и разговор закончился неуспешно;
- 3 успешных бронирования;
- 2 неверно набранных номера, когда Даша попали не в ресторан, а в другие организации.
В конце второй недели доработки модели, Даша в выборке из 50 разговоров успешно проводила диалог в 93% разговоров. Google Duplex на момент релиза успешно завершал всего 60% разговоров, остальные переадресовывал на живого человека. В 2021 году Google Duplex уже успешно проводил 80% звонков.
Как нам удалось побить результат Гугла
Во время проведения эксперимента я столкнулся с тем, что иногда вместо менеджера на звонок отвечает автоответчик, не все сотрудники ресторанов спрашивают детальную информацию о заказе и иногда приходится брать разговор в свои руки.
Научил определять автоответчики
Даша должна была научиться определять автоответчик и не разговаривать с ним. Проблема была в том, что Даша ориентируется по смыслу сказанного, а в США на автоответчики часто записывают произвольную речь, поэтому нельзя было опираться на извлечение смысла из фраз, потому что он всегда разный.
Проблему удалось решить только путем от обратного: я считал за робота любого, кто не «доказывал», что он человек. Например, я заметил, что люди почти всегда говорят «good morning/day/afternoon» или «how may i help you», поэтому я создал запрос — определенные смыслы фраз, которые гарантировали, что говорит человек. Это почти решило проблему.
Еще оставались случаи, когда трубку снимал человек, но вел себя необычно, например просто говорил «Hello». Тогда Даша начинала разговор с приветствия и ждала подтверждения, что это человек. Таким образом мне удалось примерно с 99% вероятностью правильно определять автоответчики.
В начале разговора Даша пытается определить автоответчик. Когда понимает, что это человек, то продолжает разговор и успешно его завершает:
Научил инициировать разговор
Бывали случаи, когда менеджеры ресторанов на вопрос Даши «Hello! Can i book a table for today?» отвечали «okay» вместо ожидаемого вопроса о времени бронирования или количестве персон.
Пришлось сделать так, чтобы Даша в таких случаях сама вела диалог дальше. Иногда доходило до смешного.
Научил вести нелинейный разговор
В процессе разработки модели я столкнулся с тем, что люди могут внезапно попросить повторить информацию, сказанную ранее — имя, номер телефона, время бронирования. Сначала я попытался решить эту проблему самым простым путем — признаваться, что Даша робот. Я подозревал, что эта плохая идея, но даже Гугл в своей рекламе показывал, что Duplex в начале звонка говорит, что он робот. Когда я попробовал сделать так же, 90% людей просто бросали трубку.
Тогда пришлось прибегнуть к нелинейной модели разговора — это когда разговор может вернуться к предыдущей точке. Я создал модель, в которой реплики связаны не переходами, а правилами. Даше нужно только правильно понять смысл сказанного, и уже не важно, в каком месте разговора это произойдет.
Каждый может создать себе голосового ассистента на платформе Dasha.ai
Я понял, что Даша — это очень перспективная разработка. Потому что на платформе есть весь функционал для создания разговорных моделей на любые темы без использования сторонних сервисов.
В январе 2021 года мы запустили закрытое бета-тестирование нашей платформы Dasha.ai для быстрой и легкой разработки голосовых моделей и чат-ботов. Каждый желающий может скачать приложение, получить API-ключ от платформы и написать разговорную модель для телефонного разговора или управления «умным» прибором с микрофоном и доступом в интернет.
Технология адаптируется под любую задачу, для которой можно написать скрипт: опросы, прозвон клиентов, проверка актуальности заявок, обзвон кандидатов на работу.
Я за 2 недели разработал аналог Spacex, который создавал целый штат разработчиков несколько лет. Хули нам )
Я за 2 недели изобрёл способ съесть шаурму не пролив соус.
я б почитал)
Ну да, ну да, за две недели )
Подключить в питоне тензор-флоу и несколько либ с гитхаба, которые ваяли гугл несколько лет.
Называется "стоя на плечах гигантов" делаю громкие заявления.
у нас платформа, на ней можно создавать разные голосовые модели. Модель в этой статье - лишь частный пример.
На платформе у нас полностью свои сервисы распознавания, синтеза речи, выделения посыла из фразы пользователя, диалоговый движок (исключая русский синтез речи, английский - наша разработка)
а вот "стоя на плечах гигантов" полностью согласен, но все мы на них стоим. Например я печатаю с ноутбука, в котором куча технологий, для создания которых потребовались тысячи открытий в прошлом
А ещё, данная фича интегрирована в смартфоны от Гугла, и там эта фишка прикольная, но увы, не работает в России
А ещё у Гугла, эта фишка удобна тем, что звонок можно вести с помощью чата, например упрощает жизнь глухих людей,
Комментарий удален модератором
Статья интересная, но заголовок, к сожалению, кликбейтный. Во-первых, явно описываемая система разрабатывалась и тестировалась не за две недели. А во-вторых, стоит учитывать, что когда Гугл начинал разработку дуплекса, открытых технологий и моделей, инструментов, было меньше. Это как запускать сейчас BERT на старых NLP-соревнованиях и хвастаться тем, что он значительно побил лучший результат на момент проведения соревнования.
"За 2 недели"
У вас репозитории редактируются уже почти год. Исходный код лежит с конца 2020 года. Можно узнать, что заложено в понятие 2 недели?
—-
"Когда в январе 2021 с командой запустили первую версию платформы"
Тогда она уже была в разработке минимум 4 месяца.
—-
"Меня зовут Александр Зайцев, и я сооснователь компании Dasha.ai"
Не могу понять. На сайте вас нет в списке разработчиков. На GitHub в основном контрибьютили 3 человека: Vlad Chernyshov, Ilia Pozdnyakov, Andrey Chernykh.
Во-первых, эту Дашу очевидно разрабатывал не один человек, тоже штат, хоть и не очень большой (У Google, к слову, тоже такие команды есть, не удивлюсь, если их штат был таким же, как и ваш в рамках Duplex).
Вместе с вами штат разработки уже минимум 4 человека.
—-
- разговор шел нормально, но внезапно прервался;
- человека без видимой причины перестали отвечать;
- пустых звонка, когда трубку сняли, но ничего не сказали;
- разговора с ошибками, когда Даша сказала что-то не то и разговор закончился неуспешно;
- 2 неверно набранных номера, когда Даша попали не в ресторан, а в другие организации.
В какую категорию вы относите эти звонки? Все они, потенциально, могли закончиться или закончились неудачно.
В выборке из 23 прозвонов я вижу только 10, которые наверняка можно назвать удачными: когда ресторан не бронировали и когда он успешно был забронирован. Остальные случаи нельзя учитывать в статистике "успешные/не успешные", поскольку их исход неизвестен.
—-
" Dasha.ai — это неотличимый от человека ИИ для разработчиков и бизнеса."
Даже при 93% это неверное утверждение. Пока из ваших же тестов увидел результат ниже 50%, что очевидно не соответствует утверждению.
"У вас репозитории редактируются уже почти год." - если я вас правильно понял, то вы смотрите на https://github.com/orgs/dasha-samples/repositories - там много моделей, есть старые, которые действительно созданы что то около середины 2020 года, тогда платформа еще не была "запущена" для сторонних разработчиков.
"Тогда она уже была в разработке минимум 4 месяца." первые модули платформы начали разрабатывать еще в 2018 году.
"Вместе с вами штат разработки уже минимум 4 человека." - я сооснователь компании, но не разработчик. Поэтому не являюсь создателем платформы, которую писали около 25 инженеров с 2018 по текущее время. Вообще, это отдельная большая история, может статью и об этом напишу, если интересно.
"Пока из ваших же тестов увидел результат ниже 50%" это один из промежуточных результатов, не конечный.
"Даже при 93% это неверное утверждение." - строго говоря, даже при 100% это не так, потому что стоит немного отклониться от темы и робот не сможет обработать вопрос корректно. Тут смотря что закладывать.
Вообще, вы задаете интересные вопросы, я могу написать отдельные статьи на некоторые из вопросов (потому что развернутый ответ можно написать как отдельную увлекательную историю на пару страниц)
С массовым введением роботов качество работы call-центров стало ниже плинтуса. В итоге постоянно пытаешься добиться чтобы соединили с оператором. При этом роботы постоянно тебя не понимают, но упорно не хотят соединять с человеком, и рассчитаны похоже на разговор с таким же роботом. Эти роботы прогресс из разряда победы пласстмассового мира.
Лет 10-15 один наш клиент, очень большой банк, получил приз "Колл-центр года" или что-то около того, где одним из критериев, по сути, была просто невозможность в голосовом меню найти человека.
Клиенты это решение ненавидели, но экономически это была просто бомба.
Банк сидел на корпоративных клиентах и видимо особо от неудобства их сотрудников не страдал.
тут надо быть умнее и быстрее выходить на диалог с оператором.
вы правы, сейчас основная проблема роботов в том, что они "тупые". Мы стараемся сделать так, чтобы проще было создавать ботов, которые не вызывают раздражение своей непонятливостью. Но конечно в итоге всё зависит от автора голосовой модели
Ну есть одно ощутимое но, при сравнении с Гуглом ... Там она работает как секретарша, а здесь тупой скрипт — даже для записи в парикмахерскую не подойдёт , тупо для холодных звонков.
И интересно сколько будет "слитых" клиентов, которые даже не будут слушать, услышав нотки робо-голоса.
Очередная бессмысленная звонилка, которая лишь приближает к полной отмене телефонных разговоров. И выкачивает денежки из наивных дурачков, которые думают, что робот сможет заменить холодные звонки.
Комментарий недоступен
Дурачки обычно пытаются сопротивляться прогрессу) Если уж просто записанный по скрипту голос позволяет быстро и дешево прозвонить несколько тысяч человек и собрать нужные данные, то что говорить про подобные голосовые модели.
И да - робот вполне себе может заменить холодные звонки, там вовсе не нужно блистать остроумием и большим кругозором.
Комментарий недоступен
уже давно общаются, если у тебя стоит бот-секретарь.
Мне в корпоративный аккаунт иногда пишут чат-боты и общаются там с моим чат-ботом. Я потом читаю и смеюсь над ними.
Когда звонят не-пойми-кто сразу спрашиваю то, чего не ждут. Робот палится "моя твоя не понимай", т.к. в скрипте нет такого смысла.
- Я из соцопроса.
- Вопросы веселые?
Голос а-ля секс по телефону - тоже робот. Досвидос.
У меня бывшая таким голосом говорила... первые пару месяцев...
А что, секс по телефону по подписке🙂
Супер)
Я подозревал, что эта плохая идея, но даже Гугл в своей рекламе показывал, что Duplex в начале звонка говорит, что он робот. Когда я попробовал сделать так же, 90% людей просто бросали трубку.
эээ, где тут побитый результат гугл? у гугла 60% успех, у даши менее 10% при равных условиях
ну и главное - гугл то два года инструменты в основном разрабатывал не писал скрипты для готовых решений
гугл пишет, что 60% разговоров робот провёл без помощи оператора, а сколько сколько из них не состоялось, когда робот сказал, что он робот - такой статистики нет. Скорее всего те-же 90% брошенных трубок
После заголовка можно не читать.
Dasha.ai - это примерно как парикмахерская "Светлана"
Комментарий недоступен
насчет заголовков - я много раз видел на VC хорошие, вычитанные статьи, в которых точно и по делу пишется о чем-либо. Только у них просмотры почти отсутствуют, как и комментарии. Людям в массе это скучно читать, увы.
Вы себе как-то неправильно тест Тьюринга представляете.
Банально из Википедия: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».
Банально рассмотреть в скрипте все ветки не значит, что машина прошла тест Тьюринга. Сколько я платформ не видел и со сколькими не работал - ЦРТ, АСМ (модели, синтез), МАИКС и прочие везде и всегда комплексные проблемы - (а) нестандартные вопросы (б) излишняя связность между блоками в скрипте и (в) полный провал при длительных диалогах (в частности - опросные / маркетинговые направления).
Работает +- нормально только на коротких диалогах и для классификации / категоризации обращений.
Разработчик спам бота, очень интересно
Расскажите пожалуйста где тут ai (ну, кроме распознавания речи), скрипты же. И комментариев нет совсем в коде.
Вы токсичный чел, занимающийся обесцениванием
да и распознавание речи нихрена ни разу не ai, ml
смотря, что вы вкладываете в это понятие. На мой взгляд ИИ это даже не нейронки, а что то более сложное. В статье понятие используется скорее как хайповое слово, под которым подразумевают нечто "умное"
Как сказал наш главный научный сотрудник "Главная проблема ИИ в том, что когда его сделают, его перестают считать ИИ"
Не давайте Дашу коллцентрам банков
Цитата из Ютуб канала научпопа: "люди десятилетиями пытались понять работу фотосинтеза, а я вам все объяснил за 5 минут. Лол"
Типичный рекламный вброс. Работал я в стартапе подобного направления. Турецкий продукт Sestek, ссал в уши про 93% распознавание речи и синтезом на соточку. По факту не вытянул даже 40% на деле и заказчик такого продукта быстро закрыл лавочку. Хотя презентация была на уровне : 😏
Турки без ссанья в уши не проживут и дня. Пока есть глюпай Наташа, живьется харашо
Телефонные роботы - самое омерзительное, что случилось с телефонами за сто лет существования телефонов
Классическая телефония обязана умереть в текущем её виде.
Иначе бесконечная гонка вооружений между роботами спамерами и "защитниками" не закончится никогда.
Я пошел писать статью на эту тему и пилить новый стартап )
Не могу с вами согласиться, Роман. Голос — самый удобный и универсальный интерфейс с тысячелетней историей. Просто роботы еще не доросли до уровня даже глупого человека, потому люди и избегают их (по той же причине почему мы избегаем разговоров с бестолковыми людьми). Придёт время и говорить с роботом будет интереснее и продуктивнее, чем со средним человеком
ничто не вечно) но голосовой ИИ это всего лишь инструмент и как любой инструмент, его можно использовать как во благо, так и во вред.
Чтобы во вред его использовать было нельзя, нужны защитные механизмы, которые также должны появиться
Интонирование у неё отличное, на мой вкус конечно. Мин обороне нужно продавать для секса по телефону для солдат))
Кликбейтный заголовок и тон статьи подрывает доверие к вашей, по видимому, неплохой разработке. Я сперва подумал, из-за заголовка, что вы просто взяли наработки гугла, выдав их за собственные.
Комментарий удален модератором
Когда гугл сделал кучу RnD-работы и выложил в опенсурс, а потом крутой хакер Вася пришёл, допилил немного под свои нужды и теперь говорит, что он один превзошёл всю компанию. Ну-ну.
Ещё один бот-звонилка для впаривания всякой фигни. Из-за таких как вы я больше не беру трубку с левых номеров
помню, еще в советские времена, бабушка решила заказать мне билеты на поезд по телефону и после слов "с вами говорит робот-автоответчик...", она такая:
- Роберт? Подожди Роберт...
Выаши 93% на основе выборки в 50 звонков, а у Гугла 80% на какой выборке получилось? Без такого сравнения выводы делать как минимум некорректно, не говоря уже о триггере соединения с оператором, которого у вас нет, а вы просто ждёте когда закончится разговор, а Гугла какой-то все же есть.
Про выборку Гугла мне к сожалению не известно, но я понимаю, что чем больше выборка, тем точнее процент. Но в любом случае, не думаю, что на выборке в 500 разговоров ситуация будет серьезно отличаться. Я же звонил партиями и на каждой партии был виден прогресс, последняя партия и показала 93%, до этого чуть меньше, с ходу не скажу, не помню.
А может это такой план, вбросить очевидный кликбейт что бы получить максимум коментов и откликов, а мы ведёмся?
Комментарий недоступен
могла звонить, да)
у нас есть клиент с таким кейсом
Александр, а инвестор ваш, разве не помогает с выходом на рынок? Зачем эта статья на vc? У вас там серьёзные люди) дали денег)
сфокусировались на США, но не пошло видимо. Пришлось возвращаться в РФ, там еще есть история с основателями, до данного проекта.
Кажется весь мир идет к тому что звонки будут отмирать в пользу чатов и смс, большинство людей на свете не любит звонить кому-то или отвечать на незнакомые номера)
1) Зачем такой хайповый заголовок?
2) общался я с разными роботами. Беглую речь они ни на одном языке не понимают. Слэнг тем более. Как с дурачками надо разговаривать. Основная проблема, что носители одного и того же языка с разных мест планеты друг друга не понимают. Куда там роботам
Пользуюсь Дусей уже больше 8 лет. Прописал все макросы и не знаю бед.
Да в том и дело, что АИ особо то и нет, везде тупой мэтчинг
Автор красава - всегда можно сделать чтото лучше, и логотип гугла ещё не залог высшего качества, так как там работают такие же люди как и мы. Но вот насчёт 2 недель я может чего то не понял - ты с нуля всё делал, или же взял их наработки и доделал до своего проекта?
с нуля писал голосовую модель на базе платформы
Комментарий удален модератором
Комментарий недоступен
что вы имеете ввиду?
Александр, судя по первому видео на вашем сайте, стричься вы будете весь четверг с утра до самого вечера. Интересная парикмахерская, конечно.
в рамках демки действительно нет выбора времени. Задача была показать, что бот может следовать по нелинейному диалогу.
На самом деле, эта демка не годится для реального использования, там нет ни интеграции с БД, ни выбора времени, типа стрижки, мастера и прочее
Круто говорит, действительно на живого человека похоже
то, что говориться на русском - это не синтез, это предзаписанные фразы человека. Синтез на англ языке. На всякий случай решил напомнить)
Нужно смотреть что внутри у Даши. Обычно оказывается куча фреймворков и библиотек которые и создавали команды из гугла, но я ни чего не утверждаю
Подозреваю, что не за горами время, когда напишут ботов для разговоров с этими Дашами. С Плеймаркета в каждом телефоне....
Чет я не понимаю, это разве настолько долго и неудобно нынче звонить и бронировать столик? Мне порой кажется, что компании и отдельные разрабы уже от кризиса идей начинают доить технологии по максимуму, выдавая продукт с уж очень специфическим функционалом.
В любом случае, я бы не стал доверять никаким цифровым помощникам в выборе ресторана и бронировать места, не узнав заранее о возможных депозитах и столиках с наиболее комфортным расположением.
Напишите бота, который будет красиво отвечать на комментарии на виси)
Я за пол дня пиз.. ь научился, лучше, чем Путин, почему я не президент
А голос приятный. Вы бы что ли большим компаниям типа МТС или Сбер предложили свои услуги. А то у лидеров ИТ отрасли России головые помощники все как на подбор с неприятными голосами и соображаловкой
они хотят, чтобы решение было полностью внутри их инфраструктуры + предлагают цены, которые находятся на границе себестоимости. Думаю, в будущем, если мы как компания будем развиваться правильно, всё будет.
Молодцы, желаю успехов! Я занимаюсь CRM уже много лет, хорошей технологии в этом сегменте как раз не хватает.
Очень Круто страховки допродаёт.
Прям рывок в AI
Правда мне пока Даша не звонила)
дело не в том, что она круто допродаёт, а в том, что стало проще теперь ботов создавать: на платформе всё для этого есть. Единственный минус - надо знать java script как минимум
Если все действительно выглядит так, то просто отлично. Попробую ваше api потыкать.
отправьте нам запрос через обратную форму
Комментарий удален модератором
@Инспектор
Хм, где-то я уже слышал этот диалог с полисом осаго пару лет назад.
Ещё тогда помню отметил секси голос.
А вот английский голос какой-то совсем всратый
Просто ппц
Комментарий удален модератором
Комментарий удален модератором
Комментарий недоступен
И я
Вот кто мне звонит каждый час!
есть много разработок получше, чем известные и адвно раскрученные, но им не дадут продвигаться те, кто поставляет разную фигню от корпоративных разработчиков, способных затоптать конкурентов
Приведите несколько примеров.
Комментарий удален модератором
Комментарий удален модератором
Комментарий удален модератором
Комментарий удален модератором
Интересно было почитать
Задумка интересная и надо сказать реализация оч достойная. Дерзайте!
Тест Тьюринга все же предполагает, что человек в курсе происходящего и перед ним стоит задача отличить бота от человека.
Есть много вариаций теста Тьюринга https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82_%D0%A2%D1%8C%D1%8E%D1%80%D0%B8%D0%BD%D0%B3%D0%B0#%D0%92%D0%B0%D1%80%D0%B8%D0%B0%D0%BD%D1%82%D1%8B_%D1%82%D0%B5%D1%81%D1%82%D0%B0_%D0%A2%D1%8C%D1%8E%D1%80%D0%B8%D0%BD%D0%B3%D0%B0
мы под таким, ограниченным тестом Тьюринга имеем ввиду, что ничего не подозревающий человек за время разговора с роботом не должен понять, что говорит с ботом
Комментарий удален модератором
Видел обзор - реально впечатляет. Трудно поверить что за две недели такое можно было запилить
Гугл делает систему, которая понимает в диалог (откуда и название), опираясь на предыдущие разработки синтеза и распознания речи.
А вы сделали набор скриптов для спам бота.
Что общего у этих двух систем? Где тут AI? Как их вообще можно сравнивать?
Понятно, вы хотели ажиотажа, но зачем подменять понятия и вводить в заблуждение, репутация же важна, или нет?
Почитайте Максима Ильяхова, он научит писать правду.
Спасибо, но я умею писать правду и без Ильяхова)
Кстати, а что вы подразумеваете под словом "понимает"?
"4 человека без видимой причины перестали отвечать"
Побежали прятаться в бункере от роботов.
Убейтесь все вместе со своими роботами. Задолбало через них пробиваться к людям!
Не понимаю почему столько негатива. Ну есть сервис для генерации голосового помошника. Плати и получай новый экспириенс от своего приложения. Главное чтобы сырым это не было. Я с Виктором Осетровым из realspeaker знаком. Он 7 лет толкового распознавания по исходному аудиофайлу не смог добиться.
Для аренды жилья посуточно пригодилось бы, чтобы вместо меня это делала дашка). Тут правда много нюансов.. какая кв., на какой день, время, сколько лет, сколько человек, бронь.
нуу, все можно сделать. Только для аренды жилья - на это есть airbnb, booking и т.п. Там уже все и так вроде отлажено.
Имею в виду, что не все задачи оптимально решать через голосовое общение
День добрый! Заинтересовало, спасибо за ссылку на тестовую версию
Ну гуд, что сказать. Перспектива для проекта хорошая как мне кажется, спрос на подобные модели программ сейчас высокий.
Не то чтобы идея новая, но исполнение реально достойно респекта на мой взгляд.
Скорее за две недели довел до ума, как я понял из написанного база-то какая-то на тот момент уже была. В любом случае недурно, даже очень.
Писал вам в поддержку. Хотел сделать обзвонщика и за 2 года мне так и не ответили 🤣. Крутой проект, что могу сказать