«ВКонтакте» открыл сторонним разработчикам доступ к собственным технологиям распознавания речи Статьи редакции

Их можно интегрировать в любые проекты — от мини-приложений в соцсети и игр до сторонних стартапов.

  • Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++. «Применение технологии ограничено только фантазией разработчиков: можете сделать игру с голосовым управлением или с помощью чат-бота добавить распознавание аудио в сторонний мессенджер», — пояснил он.
  • Речь о технологии Automatic Speech Recognition, или ASR, которая распознает устную речь и преобразует её в текст. Она работает при помощи трёх нейросетей: одна отвечает за само распознавание, вторая находит подходящие слова, третья расставляет знаки препинания. По словам компании, инструмент обрабатывает записи за несколько секунд, хорошо справляется с посторонними шумами и паузами, неразборчивым произношением, а также сленгом и сокращениями.
  • Для распознавания работают две модели: нейтральная — для ясной речи, как, например, в телешоу или интервью, и спонтанная — для непринужденных бесед и монологов с разговорной и ненормативной лексикой.
  • Компания предлагает две версии ASR: одна позволяет обрабатывать до 100 минут аудио в сутки, другая не имеет ограничений по времени, но её нужно запрашивать отдельно — отправив заявку.
  • Технологию можно протестировать на отдельной странице, а также интегрировать через публичный API «ВКонтакте». Методы, с помощью которых создаются мини-приложения для «ВКонтакте, доступны по ссылке. «ВКонтакте» надеется, что сможет получить от разработчиков обратную связь, которая поможет им совершенствовать продукт в будущем.
0
44 комментария
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Бро

голос сразу будет сопоставляться с электронной картотекой.

Ответить
Развернуть ветку
Невероятный Блондин

Биометрия сама себя не соберёт

Ответить
Развернуть ветку
Георгий Чеботарёв

Ха-ха)))

Ответить
Развернуть ветку
Митя Иконников

Не, в Ленгли, Вирджиния. Говорите спокойно, ничего не бойтесь!

Ответить
Развернуть ветку
Евгений Морозов

Это реально классная новость!
Больше продуктов на рынке - выше конкуренция - выше качество

Ответить
Развернуть ветку
Konstantin T.

Технологии с товарищем майором? Сейчас бы в 2022 начинать пользоваться "технологиями" ВК. Спасибо.

Ответить
Развернуть ветку
Валерий Вотяков

Зато с майором США вам спокойнее)

Ответить
Развернуть ветку
Митя Иконников

Современный товарищ майор умнее, дисциплинированне, прогрессивнее и успешнее любого либерального хипстора, который отстал на уровне адаптации чужих решений в свой говнокод, так что норм.

Ну а серьёзно, сторонники прекрасной россии будущего нам технологий своих не показали, приходится юзать лучшее что есть - майоровое!

Ответить
Развернуть ветку
Руслан Корнев

Судя из статьи открыли доступ к API, следовательно заголовок неправильный.

Ответить
Развернуть ветку
Никита Сокол

Работать так же криво будет?

Ответить
Развернуть ветку
Кирилл Неласов

🤡🤡 у вк отличное распознавание

Ответить
Развернуть ветку
Никита Сокол
Ответить
Развернуть ветку
Полина Лааксо
Автор

самое время проверить 🫡

Ответить
Развернуть ветку
Антон Тарасов

да ну, в ВК распознавание вполне себе

Ответить
Развернуть ветку
Дмитрий Перепродажный

Да, все еще через жопу. Польза сего в деле по-прежнему неясна.

Ответить
Развернуть ветку
Пишущий незнакомцам

ну если догадываться зная хорошо язык,то понять можно

Ответить
Развернуть ветку
Айрат Галиуллин

Спасибо за щедрость 🤫

Ответить
Развернуть ветку
Михаил Балакин

главное что не данными пользователей

Ответить
Развернуть ветку
Российский Крым

Можно превращать аудиокниги в обычные.

Ответить
Развернуть ветку
Андрей Соколов

Какой недооценённый комментарий

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Иван Тищенко

Впервые буду не ругать вк а хвалить, неужели хоть что-то получается, молодцы

Ответить
Развернуть ветку
Anfilatova

А смысл? Типа у Вк в этом плане успехи? Я так не думаю, предложения распознаются ужасно, даже с учётом того , что записано в идеальных условиях.

Ответить
Развернуть ветку
Зеленый и громкий

Определенные слова он будет очень хорошо распознавать.

Ответить
Развернуть ветку
Alex cooberr

Из базы СОРМ?)

Ответить
Развернуть ветку
Влад

Ждем ее в тг?)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Влад

Ну так то тг платит за это гуглу, а тут бесплатно все. По крайней мере для русского языка. Тг и так убыточен, сэкономить в этом плане лишним не будет

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Влад

Ну во первых я думал, что они выложили исходники, а не просто сделали API, а во вторых меня гугл аналогично смущает, как и вконтакте. Так что если говорите про АП, тогда пожалуйста не забывайте упоминать и фбр, причем это не переписка, а голосовые, что делает априори эти сообщения мусорными, как и все голосовые

Ответить
Развернуть ветку
Митя Иконников

Врядли в своей личной переписке ты можешь удивить бывалую гебню. Да и никого в этих комментах наверное не удивишь. Так что сохранность твоих данных обеспечивается жесточайшим непробиваемым и невзламываемым никакими математиками и хакерами "всем похуй"-ем.

Ответить
Развернуть ветку
Sasha Belousov

Не совсем бесплатно

Ответить
Развернуть ветку
Egor Krasnov

Насколько я знаю - не платит.
Они использовали неофициальное API гугла (видимо стащили из одного из их сервисов), как раз чтобы не платить.

Ответить
Развернуть ветку
Dima

Совершайте голосовые звонки, говорили они.

Ответить
Развернуть ветку
Митя Иконников

Совершайте написание текстовых сообщений.
Осуществляйте визит на наш веб-сайт через браузер!
Производите реализацию отправки через телекоммуникационные каналы связи HTTP-запросов на сервер нашего интернет-магазина для осуществления приобретения предлагаемого нами качественного товара.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Roman Yakunin

Протестировал аудиодорожку с хорошим качеством и чётким текстом, результат был довольно грустный. Сейчас проект похож на ьмз

Ответить
Развернуть ветку
Полина Лааксо
Автор

ребята рады любой конструктивной обратной связи и очень ее ждут, если что :—) можно написать им напрямую

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Please be patient ihave autism

Оно только русскую речь понимает?

Ответить
Развернуть ветку
Please be patient ihave autism
Пока нейросеть воспринимает только русский язык.
Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Абвгде Ёж

Браво, можно похвалить

Ответить
Развернуть ветку
41 комментарий
Раскрывать всегда