Лого vc.ru

Яндекс подарил мобильным разработчикам распознавание голоса

Яндекс подарил мобильным разработчикам распознавание голоса
Поделиться
“Самое качественное в мире распознавание русскоязычных голосовых запросов, которое мобильные разработчики могут бесплатно встраивать в свои приложения для iOS и Android” — звучит слишком хорошо, чтобы быть правдой. Или не слишком? Прямо сейчас на Yet another Conference “Яндекс” представит свою новую технологию Yandex SpeechKit, а “Цукерберг Позвонит” уже узнал все об этом проекте из первых рук — от его руководителя Дениса Филиппова.

IMG0filippov

Евгений Трифонов: Какие тут у вас конкуренты и в чем ваши преимущества?
Денис Филиппов: У Google существует Speech API, он поддерживает русский язык. Но он доступен только в Android, а не iOS, и, по данным наших исследований, наше качество распознавания русского выше. В iOS встроенного распознавания русского нет вообще. Есть еще сторонние движки распознавания речи, например, от компании Nuance, но они платные и тоже не всегда хорошо поддерживают русский язык.

Трифонов: Как реализован SpeechKit — все запросы из приложений отправляются на сервера Яндекса и обрабатываются там?
Филиппов: Да, обработка в облаке. Каждое приложение, использующее SpeechKit, сможет бесплатно отправлять до 10 000 запросов в сутки.

Трифонов: А если ему нужно больше, может докупать за деньги?
Филиппов: В будущем сможет, мы готовы договариваться с гигантами и хотим работать по модели freemium, но пока что надо сначала как следует опробовать бесплатный режим. Поэтому сейчас никаких конкретных сумм и дат для желающих пока не озвучиваем.

IMG1speechkit

Трифонов: Сейчас много паранойи по поводу сохранности пользовательских данных — раз запросы из всех приложений пойдут к вам, наверняка кто-то начнет паниковать, что вы долгими зимними вечерами у камина слушаете чужие секреты. Есть что возразить?
Филиппов: Запросы приходят к нам обезличенно, у нас нет возможности узнать, от кого именно пришел каждый конкретный. То же самое давно происходит с встраиваемым поиском от “Яндекса”, только там мы получаем текст, а не звук.

Трифонов: Ставите ли вы разработчикам условия “для чего именно можно использовать Yandex SpeechKit”? Например, должно это быть связано с ключевым для вас веб-поиском?
Филиппов: Нет, приложения могут использовать распознавание голоса для любых целей, привязки к поиску нет.

Трифонов: Тогда напрашивается нескромный вопрос “А для чего Яндексу вообще понадобилась вся эта благотворительность?”
Филиппов: Причин несколько. Во-первых, голосовое распознавание учится на конкретных примерах, поэтому чем больше запросов оно обработает, тем качественнее станет. Во-вторых, мы заинтересованы в росте популярности мобильных приложений и хотим помогать мобильным разработчикам. А, в-третьих, мы заинтересованы в развитии голосовых технологий, это важное для нас направление.

IMG2speechkit
Популярные статьи
Показать еще