{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Бесплатное распознавание речи для всех желающих

Бесплатное распознавание речи для всех желающих

После относительно недавнего релиза мы сделали наше распознавание речи бесплатным для всех индивидуальных пользователей на страничке по адресу — https://audio-v-text.silero.ai/.

Да, вы не ослышались. Это не шутка, не очередная кампания по продаже "шпионских" гаджетов, не альтруизм и не обман:

  • Да, сервис сделан для простых людей, и там есть разумные ограничения на объем, перепродавать не получится (а если у кого-то получится, то нам придется или закрутить все сильнее, или закрыть сервис).
  • Да, мы предприняли разумные меры, чтобы сделать все безопасным как для нас, так и для пользователей.
  • Да, этот сервис будет бесплатным.
  • Да, мы полностью независимы и никак не аффилированы с теми самыми компаниями (если вы понимаете, о чем я).

Как Пользоваться

Инструкция простая до банальности:

  • зайти на страничку,
  • опционально попробовать демку с микрофоном,
  • залить свой файл в формочку,
  • получить распозанный файл на email.

По идее должно работать во всех основных браузерах. Рекомендуется заходить с ноутбука или десктопа, но и со смартфона в принципе тоже должно работать.

Не лишним будет упомянуть: правильно указывая, из какого домена (какого типа) ваше аудио, вы поможете повысить качество распознавания вашего аудио.

Идея Сервиса

Если сейчас обычному физическому лицу нужно что-то транскрибировать, то на рынке есть опции:

  • Есть решения, требующие регистрации, оплаты, создания личного кабинета.
  • Есть ограниченное количество корпоративных решений, которые, по очевидным причинам, тоже не закрывают этот случай.
  • Есть большое количество ML репозиториев, устаревших решений или поделок народных "умельцев". Но "обычный" пользователь вряд ли может ими воспользоваться.

Резюмируя: нет качественных решений для "маленьких"/одноразовых случаев использования (без геморроя и высокого порога входа). Мы решили это исправить. Будем признательны за вашу конструктивную обратную связь.

Текущие Ограничения

У сервиса в текущем виде есть ряд ограничений, часть которых решается технологически, а часть только процессуально:

  • Хотя мы можем разделять заранее известное количество говорящих, это не вошло в MVP сервиса.
  • Многоканальное аудио в MVP не разделяется и обрабатывается после усреднения каналов.
  • Наличие большого количества жаргона, англицизмов или очень редкой уникальной лексики негативно влияет на распознавание. Конечно это решается, но скорее уже в рамках отдельного проекта или с помощью ручной пост-обработки.
  • Чем лучше качество исходного аудио, тем лучше качество транскрибации.
  • На данный момент пунктуация и заглавные буквы автоматически в сервисе не проставляются, хотя мы в это умеем.
  • Для некоторых случаев, даже при хорошем качестве аудио и с учетом автоматической простановки знаков препинания, нужна пост-обработка людьми. Мы пока не предлагаем такой сервис.

Безопасность и Использование Данных

Мы используем лучшие из доступных нам инструментов. Мы шифруем трафик и данные. Мы блокируем ботов и пресекаем нецелевое использование.

Для любителей разоблачений и теорий заговора: основной целью сервиса является улучшение качества распознавания в конкретных доменах с использованием данных пользователей. По этой причине просим всех пользователей прочитать оферту и убедиться, что все посылаемые данные не содержат чувствительной или запрещенной информации. Мы не будем публиковать или делиться этими данными с третьими сторонами, но, естественно, подходите к своим и чужим данным ответственно и используйте сервис на свой страх и риск.

0
87 комментариев
Написать комментарий...
Game Topia

Я бы испугался пользоваться подобным сервисом с реальной почтой. Да и к почте за результатом потом только через api обращаться чтобы исключить ловушки.

Ответить
Развернуть ветку
Alexander Veysov
Автор

Никто не заставляет использовать прямо реальную почту.

Мы долго думали какой минимальный набор мер надо принять, чтобы архитектурно пресечь спам и DDOS, и использование email, к сожалению, показалось нам неизбежным.

Ответить
Развернуть ветку
Game Topia

А почему вам лимит на а операции не оказался более эффективным и простым в реализации?

Ответить
Развернуть ветку
Alexander Veysov
Автор

Так там и так есть лимит.

Не совсем понимаю, конкретно в чем вопрос. Наличие имейла, это лишь малая толика того, как там настроено противодействие спаму.

Если нет регистрации, проверки телефона, зачисления денег на счет, итд итп - как вы собираетесь ботов от людей отличать?

Ответить
Развернуть ветку
Николай Судиловский

Вы сейчас общаетесь с тем типом людей, который носит шапочку из фольги, а также думает что его телефон прослушивают , ватсап просматривают чтобы узнать его мнение о предстоящей предвыборной компании или найти фото дикпиков. Это не ваша целевая аудитория.
Вот вам ца: офисные работники, записывать текст встреч и вести протоколы. В РЖД у нас специальный человек аудиозапись слушал, печатал ; обычные физики, кто ценит свое время
У вас там стартап ?)

Ответить
Развернуть ветку
Game Topia

Даже слово "да" нельзя по телефону говорить, а вы предлагаете целые аудио спектакли отправлять. При чем здесь фольга, это элементарные правила интернета.Подобные записи это подарок для жуликов, которые с помощью синтеза речи смогут создать ваш законченный фейковый профиль.

Ответить
Развернуть ветку
Николай Судиловский

Вы прекрасно понимаете, что данные и на вас и на меня. Слова да, уже есть в интернете в десятках баз. Ватсап телеграмм обычные телефонные разговоры и тд

Ответить
Развернуть ветку
Alexander Veysov
Автор

С одной стороны я давно удалил соцсети и стараюсь не иметь никаких персональных данных в интернете. С другой стороны люди не понимают, что почта для спама это далеко не те данные, за которыми охотятся экосистемы.

Грубо говоря ваше поведение, фото, интересы - вот это продукт. Мы прямо заявляем зачем нам нужно аудио и намекаем как мы выстроили процесс защиты от ДДОСа.

Имейл есть у 99% пользователей. У многих есть имейлы для "спама". Так что в случае нас - вы надумываете проблему. Мы не ставим шпионские девайсы в вашу гостиную, не слушаем вас по ночам итд итп. Вы сами принимаете решение что послать. Ключевое слово - сами.

Ответить
Развернуть ветку
Alexander Veysov
Автор

https://www.silero.ai/

У нас свои системы распознавания и синтеза речи

Ответить
Развернуть ветку
Game Topia

А бот что не может почту ввести?

Ответить
Развернуть ветку
Alexander Veysov
Автор

Если вы напишете бота, который сможет обойти все проверки, будем признательны за инсайд.

Ответить
Развернуть ветку
84 комментария
Раскрывать всегда