«Яндекс» запустил облачную платформу распознавания речи

Компания «Яндекс» запустила облачный сервис SpeechKit Cloud, при помощи которого разработчики могут встроить в свои продукты технологию распознавания речи. Сервис анонсировали на финале чемпионата «Яндекс.Алгоритм» в Берлине.

На данный момент облачный сервис распознавания речи использует компания Oktell, выпускающая программное обеспечение для колл-центров — технология позволяет понимать речь звонящего в колл-центр человека, чтобы соединить его с нужным специалистом. Cubic Robotics, выпускающая домашних роботов CUBIC, также внедрила технологию, чтобы робот понимал все команды хозяина.

Технологию можно использовать в широком спектре продуктов: от игр до навигационных систем. Она применима в медицине (для протоколирования операций) или в телефонии (для автоматизации работы колл-центров). Платформу можно внедрить в бытовые приборы, автомобили, «умные дома» и т.д.

Как отмечено в названии сервиса, это — облачная технология: голосовые запросы обрабатываются на серверах «Яндекса». Распознавание занимает около секунды. SpeechKit Cloud понимает два языка — русский и турецкий.

Технологию Yandex SpeechKit «Яндекс» запустил в 2013 году. На настоящий момент ею пользуются более 400 приложений для iOS, Android и Windows Phone (справочники и каталоги, геоинформационные приложения, игры, магазины), и она обрабатывает миллионы голосовых запросов ежедневно. В основу технологии SpeechKit положены акустические и языковые модели, построенные с использованием нейронных сетей, которые обучаются на больших массивах данных.

Система умеет распознавать команды и поисковые запросы, географические запросы, короткие тексты. В дальнейшем появится возможность работать с длинными текстами — создавать расшифровки лекций, интервью, видеозаписей. Распознавание происходит почти в реальном времени — задержка не превышает одной секунды. Точность распознавания запросов достаточно высокая: для коротких запросов она составляет 85%, для геозапросов — 95%, для текстов — 82%. Человек распознаёт на слух 96-99% услышанного.

Yandex SpeechKit уже используется в мобильных продуктах «Яндекса» — «Яндекс.Навигаторе», «Яндекс.Картах», «Яндекс.Браузере», «Яндекс.Городе», в поисковых продуктах.

Ранее технология была доступна для сторонних разработчиков в виде Yandex SpeechKit Mobile SDK — это мультиплатформенная библиотека для мобильных приложений для iOS, Android и Windows Phone. С её помощью разработчики могут внедрить голосовое управление, голосовой ввод текста или поиск внутри приложения для тех ситуаций, когда пользователь не может вбивать запросы руками. SpeechKit Mobile SDK предоставляется бесплатно при объёме до 10 тысяч голосовых запросов в сутки. При превышении лимита условия оговариваются отдельно.

Взаимодействие со SpeechKit Cloud происходит через HTTP API, что подразумевает простоту интерфейса, высокую доступность и отсутствие затрат на поддержку инфраструктуры. Для разработчиков SpeechKit Cloud будет бесплатным в течение месяца, в дальнейшем стоимость формируется исходя из количества запросов — в среднем, $5 за тысячу.

#яндекс #распознавание_речи #SpeechKit_Cloud #технология

Статьи по теме
«Яндекс» поругался с Mail.Ru из-за блогов на «Хабре»
Обновление «Яндекс.Метрики»: 5 новых возможностей
{ "author_name": "Konstantin Panphilov", "author_type": "editor", "tags": ["\u044f\u043d\u0434\u0435\u043a\u0441","\u0442\u0435\u0445\u043d\u043e\u043b\u043e\u0433\u0438\u044f","\u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435_\u0440\u0435\u0447\u0438","speechkit_cloud"], "comments": 13, "likes": 15, "favorites": 1, "is_advertisement": false, "subsite_label": "flood", "id": 4592, "is_wide": true }
00
дни
00
часы
00
мин
00
сек
(function(){ var banner = document.querySelector('.teaserSberbank'); var isAdsDisabled = document.querySelector('noad'); if (!isAdsDisabled){ var countdownTimer = null; var timerItem = document.querySelectorAll('[data-sber-timer]'); var seconds = parseInt('15388' + '59599') - now(); function now(){ return Math.round(new Date().getTime()/1000.0); } function timer() { var days = Math.floor(seconds / 24 / 60 / 60); var hoursLeft = Math.floor((seconds) - (days * 86400)); var hours = Math.floor(hoursLeft / 3600); var minutesLeft = Math.floor((hoursLeft) - (hours * 3600)); var minutes = Math.floor(minutesLeft / 60); var remainingSeconds = seconds % 60; if (days < 10) days = '0' + days; if (hours < 10) hours = '0' + hours; if (minutes < 10) minutes = '0' + minutes; if (remainingSeconds < 10) remainingSeconds = '0' + remainingSeconds; if (seconds <= 0) { clearInterval(countdownTimer); } else { timerItem[0].textContent = days; timerItem[1].textContent = hours; timerItem[2].textContent = minutes; timerItem[3].textContent = remainingSeconds; seconds -= 1; } } timer(); countdownTimer = setInterval(timer, 1000); } else { banner.style.display = 'none'; } })();
{ "id": 4592, "author_id": 3, "diff_limit": 1000, "urls": {"diff":"\/comments\/4592\/get","add":"\/comments\/4592\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/4592"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199791 }

13 комментариев 13 комм.

Популярные

По порядку

Написать комментарий...
2

Это очень круто!

Ответить
1

Скажу по-секрету, движок Яндекс купил у какой-то шведской конторы.

Хотя есть и российские - например питерский speereo.com - у них качество вроде по-лучше чем у того движка, что купил Яндекс.

Ответить
0

и кстати speereo.com вроде и оффлайн работает

Ответить
0

Влад, здравствуйте!
Яндекс использует свой собственный разработанный движок распознавания речи. Подробнее о нем можно прочитать здесь:
http://habrahabr.ru/company/yandex/blog/198556/

Ответить
0

Сколько стартапов похоронили..

Ответить
1

Есть такие веселые ребята - Nuance. Так вот если и есть кто-то, кто хоронил окологолосовые разработки, так это они. Если кто-то выходил на горизонт известности, их в лучшем случае скупали, в худшем - давили патентными исками.

А так - те, кто строит сервис на чужих технологиях, только в плюсе - получили еще одного технологического провайдера.

Те, кто наоборот, свои технологии разрабатывали, конечно, поимели мощного конкурента - им теперь придется как-то отпозиционироваться. А тем, кто собирался распознавать не локально, а в облаке, совсем тяжко будет.

Ответить
0

А как же отечественные разработки?

Ответить
1

Опенсорсные движки: http://habrahabr.ru/post/230133/

Ответить
1

И речевые движки с АПИ: http://habrahabr.ru/post/230133/

Ответить
0

В смысле? Если говорить о чисто технологических разработках (грубо говоря, о движках для голосового распознавания) - то это B2B продукт, предназначен для разработчиков же (которые уже будут конечный продукт делать).

И тут национальность не так принципиальна. Более того, большие деньги как раз крутятся на мировом рынке, одним местным не обойтись. Если есть особенности, позволяющие отпозиционироваться от Яндекса и Гугла (например, работа офлайн) - то ниша есть, протиснуться можно. Если разработка принципиально рассчитана на работу в облаке - то на фоне Яндекса и Гугла сложно будет пробиться даже из Долины.

Ответить

Комментарий удален

0

Может взлететь гораздо больше, чем похоронили, это правда.

Ответить
0

Помните новость на прошлой неделе о том, как Бобук ругал Mail.Ru о поведении на Хабре? :)
Новость о SpeechKit Cloud я прочитал тут и в общественно-политическом СМИ, но не на профильном сайте.

Ответить

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

–4

Этому убожеству не догнать гугла и его продукции. Яндекс всегда был и будет на 5 шагов позади. И да, я фанат гугла.

Ответить
0

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } } ]
Нейронная сеть научилась читать стихи
голосом Пастернака и смотреть в окно на осень
Подписаться на push-уведомления