«ВКонтакте» открыл сторонним разработчикам доступ к собственным технологиям распознавания речи Статьи редакции
Их можно интегрировать в любые проекты — от мини-приложений в соцсети и игр до сторонних стартапов.
- Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++. «Применение технологии ограничено только фантазией разработчиков: можете сделать игру с голосовым управлением или с помощью чат-бота добавить распознавание аудио в сторонний мессенджер», — пояснил он.
- Речь о технологии Automatic Speech Recognition, или ASR, которая распознает устную речь и преобразует её в текст. Она работает при помощи трёх нейросетей: одна отвечает за само распознавание, вторая находит подходящие слова, третья расставляет знаки препинания. По словам компании, инструмент обрабатывает записи за несколько секунд, хорошо справляется с посторонними шумами и паузами, неразборчивым произношением, а также сленгом и сокращениями.
- Для распознавания работают две модели: нейтральная — для ясной речи, как, например, в телешоу или интервью, и спонтанная — для непринужденных бесед и монологов с разговорной и ненормативной лексикой.
- Компания предлагает две версии ASR: одна позволяет обрабатывать до 100 минут аудио в сутки, другая не имеет ограничений по времени, но её нужно запрашивать отдельно — отправив заявку.
- Технологию можно протестировать на отдельной странице, а также интегрировать через публичный API «ВКонтакте». Методы, с помощью которых создаются мини-приложения для «ВКонтакте, доступны по ссылке. «ВКонтакте» надеется, что сможет получить от разработчиков обратную связь, которая поможет им совершенствовать продукт в будущем.
3
показа
4.8K
открытий
Комментарий недоступен
голос сразу будет сопоставляться с электронной картотекой.
Биометрия сама себя не соберёт
Ха-ха)))
Не, в Ленгли, Вирджиния. Говорите спокойно, ничего не бойтесь!
Это реально классная новость!
Больше продуктов на рынке - выше конкуренция - выше качество
Технологии с товарищем майором? Сейчас бы в 2022 начинать пользоваться "технологиями" ВК. Спасибо.
Зато с майором США вам спокойнее)
Современный товарищ майор умнее, дисциплинированне, прогрессивнее и успешнее любого либерального хипстора, который отстал на уровне адаптации чужих решений в свой говнокод, так что норм.
Ну а серьёзно, сторонники прекрасной россии будущего нам технологий своих не показали, приходится юзать лучшее что есть - майоровое!
Судя из статьи открыли доступ к API, следовательно заголовок неправильный.
Работать так же криво будет?
🤡🤡 у вк отличное распознавание
самое время проверить 🫡
да ну, в ВК распознавание вполне себе
Да, все еще через жопу. Польза сего в деле по-прежнему неясна.
ну если догадываться зная хорошо язык,то понять можно
Спасибо за щедрость 🤫
главное что не данными пользователей
Можно превращать аудиокниги в обычные.
Какой недооценённый комментарий
Комментарий недоступен
Впервые буду не ругать вк а хвалить, неужели хоть что-то получается, молодцы
А смысл? Типа у Вк в этом плане успехи? Я так не думаю, предложения распознаются ужасно, даже с учётом того , что записано в идеальных условиях.
Определенные слова он будет очень хорошо распознавать.
Из базы СОРМ?)
Ждем ее в тг?)
Комментарий недоступен
Ну так то тг платит за это гуглу, а тут бесплатно все. По крайней мере для русского языка. Тг и так убыточен, сэкономить в этом плане лишним не будет
Комментарий недоступен
Ну во первых я думал, что они выложили исходники, а не просто сделали API, а во вторых меня гугл аналогично смущает, как и вконтакте. Так что если говорите про АП, тогда пожалуйста не забывайте упоминать и фбр, причем это не переписка, а голосовые, что делает априори эти сообщения мусорными, как и все голосовые
Врядли в своей личной переписке ты можешь удивить бывалую гебню. Да и никого в этих комментах наверное не удивишь. Так что сохранность твоих данных обеспечивается жесточайшим непробиваемым и невзламываемым никакими математиками и хакерами "всем похуй"-ем.
Не совсем бесплатно
Насколько я знаю - не платит.
Они использовали неофициальное API гугла (видимо стащили из одного из их сервисов), как раз чтобы не платить.
Совершайте голосовые звонки, говорили они.
Совершайте написание текстовых сообщений.
Осуществляйте визит на наш веб-сайт через браузер!
Производите реализацию отправки через телекоммуникационные каналы связи HTTP-запросов на сервер нашего интернет-магазина для осуществления приобретения предлагаемого нами качественного товара.
Комментарий недоступен
Протестировал аудиодорожку с хорошим качеством и чётким текстом, результат был довольно грустный. Сейчас проект похож на ьмз
ребята рады любой конструктивной обратной связи и очень ее ждут, если что :—) можно написать им напрямую
И что можно конструктивное написать из такого отзыва? Вы сделали хуйню которая плохо работает и никто её не будет использовать потому что вы мейлсру?
Оно только русскую речь понимает?
Комментарий недоступен
Браво, можно похвалить