Бесплатное распознавание речи для всех желающих
Бесплатное распознавание речи для всех желающих
После относительно недавнего релиза мы сделали наше распознавание речи бесплатным для всех индивидуальных пользователей на страничке по адресу — https://audio-v-text.silero.ai/.
Да, вы не ослышались. Это не шутка, не очередная кампания по продаже "шпионских" гаджетов, не альтруизм и не обман:
- Да, сервис сделан для простых людей, и там есть разумные ограничения на объем, перепродавать не получится (а если у кого-то получится, то нам придется или закрутить все сильнее, или закрыть сервис).
- Да, мы предприняли разумные меры, чтобы сделать все безопасным как для нас, так и для пользователей.
- Да, этот сервис будет бесплатным.
- Да, мы полностью независимы и никак не аффилированы с теми самыми компаниями (если вы понимаете, о чем я).
Как Пользоваться
Инструкция простая до банальности:
- зайти на страничку,
- опционально попробовать демку с микрофоном,
- залить свой файл в формочку,
- получить распозанный файл на email.
По идее должно работать во всех основных браузерах. Рекомендуется заходить с ноутбука или десктопа, но и со смартфона в принципе тоже должно работать.
Не лишним будет упомянуть: правильно указывая, из какого домена (какого типа) ваше аудио, вы поможете повысить качество распознавания вашего аудио.
Идея Сервиса
Если сейчас обычному физическому лицу нужно что-то транскрибировать, то на рынке есть опции:
- Есть решения, требующие регистрации, оплаты, создания личного кабинета.
- Есть ограниченное количество корпоративных решений, которые, по очевидным причинам, тоже не закрывают этот случай.
- Есть большое количество ML репозиториев, устаревших решений или поделок народных "умельцев". Но "обычный" пользователь вряд ли может ими воспользоваться.
Резюмируя: нет качественных решений для "маленьких"/одноразовых случаев использования (без геморроя и высокого порога входа). Мы решили это исправить. Будем признательны за вашу конструктивную обратную связь.
Текущие Ограничения
У сервиса в текущем виде есть ряд ограничений, часть которых решается технологически, а часть только процессуально:
- Хотя мы можем разделять заранее известное количество говорящих, это не вошло в MVP сервиса.
- Многоканальное аудио в MVP не разделяется и обрабатывается после усреднения каналов.
- Наличие большого количества жаргона, англицизмов или очень редкой уникальной лексики негативно влияет на распознавание. Конечно это решается, но скорее уже в рамках отдельного проекта или с помощью ручной пост-обработки.
- Чем лучше качество исходного аудио, тем лучше качество транскрибации.
- На данный момент пунктуация и заглавные буквы автоматически в сервисе не проставляются, хотя мы в это умеем.
- Для некоторых случаев, даже при хорошем качестве аудио и с учетом автоматической простановки знаков препинания, нужна пост-обработка людьми. Мы пока не предлагаем такой сервис.
Безопасность и Использование Данных
Мы используем лучшие из доступных нам инструментов. Мы шифруем трафик и данные. Мы блокируем ботов и пресекаем нецелевое использование.
Для любителей разоблачений и теорий заговора: основной целью сервиса является улучшение качества распознавания в конкретных доменах с использованием данных пользователей. По этой причине просим всех пользователей прочитать оферту и убедиться, что все посылаемые данные не содержат чувствительной или запрещенной информации. Мы не будем публиковать или делиться этими данными с третьими сторонами, но, естественно, подходите к своим и чужим данным ответственно и используйте сервис на свой страх и риск.
Незрелость автора и его неумение принимать критику летя с шашкой на гало с минусами смешит. Уважаемый разработчик, с таким подходом вы никогда не сделаете нормальный сервис, потому что сервис это в первую очередь общение с клиентами и принятие критики, одному не нравится тут, другому в ином месте (:
Ну он по крайней мере что то делает, и его продукт довольно серьезная штука.
Написать статью здесь и работать с комментариями, это не просто.
Пробовали?
С первого раза все круто получилось?
Я совсем недавно стал пробовать Пикабу и VC как альтернативные площадки для популяризации нашей работы и мягко говоря удивился уровню токсичности. Но так сказать средней, а не медианной (это очень важно).
Если на Хабре, несмотря на его известную токсичность, профессиональные тролли сразу попадают в пермабан (например за мат), то тут я уже видел пару таких персонажей. Сотни - тысячи комментов, все на статьях абсолютно разной тематики, все кого-то пытаются унизить, иногда опускаясь до оскорблений в духе ad hominem и прямого мата. И при этом положительная карма (!).
Понятно, что это некий симбиоз ценностей "редакции", выраженный в том, как работает продукт и публики, которую он привлек. Больше хейта => больше трафика.
Я всегда старался не "читать советских газет", но следующие факты меня повергли в шок при беглом просмотре популярных статей:
- За мат, прямые и непрямые оскорбления юзеры и переход на личности не получают инстант бан (тот же Хабр бессмысленно жесток, но там есть подобие неких неписанных правил, и только в определенных хабах они совсем неадекватные);
- Модерация сайта отсутствует или не работает (или спит). Ну или как вариант не справляется или такое в порядке вещей;
- Сайт способствует хейту показывая кто на что поставил какие оценки в реальном времени;
- Даже под этой статьей появился персонаж с интересной историей - тонна залайканных хейтерских комментов и тонна слитых. В целом карма очень позитивная. Юмор состоит в том, что в ответ на то, что я поставил дислайки его самым неадекватным комментариям, он стал минусовать вообще все мои комментарии на сайте и параллельно выставлять себя жертвой;
Откровенно говоря, я думал, что Хабр токсичен, но сейчас я понимаю, что это цветочки.
Токсичный тут ты. Ты первым перешёл на личности, сказав, что пользоваться вк - себя не уважать. А потом ещё и не аргументировал свою точку зрения, когда я спросил че за фигня. Ты просто убежал плакать.
Реально жаль, что ты не получил инстант бан за это оскорбление. Ещё и лицемеришь тут, мол ты один д'артаньян.
И даже не пробуй о своей бесполезной, неудобной и заранее устаревшей приложухе говорить в реале. А то получишь аргументированный контраргумент, начнёшь оскорблять, а тебе по роже надают (и правильно сделают)...
У меня 2 своих сервиса, я каждый день работаю с клиентами, я прекрасно знаю что нужно держать себя в руках, а не вот эти все истерики
Именно поэтому вы не используете тут реальное имя и фамилию?
Какая связь? Я обязан это делать? Я скорей переживаю что такие люди как ТС зная мои имя и фамилию, примерное место проживания и что-то еще, начнут выходить за рамки данного поста, я же не знаю меру "отбитости" ТСа, сегодня он минусит за высказывание которое ему не понравилось, а завтра пойдет искать меня по дворам (:
Я пробовал. Выступать вживую - вот где страшно и нет гугла. А комменты - это хрень. И уж тем более я никогда никому не говорил, что оппонент себя не уважает, если он пользуется популярными вещами.
И откуда вы знаете что его проект серьёзен? У меня ученики пару лет назад на конкурсе были с 6-осевым роботом с компьютерным зрением, так там первое место занял проект, который повторяется по 11 минутному видео с ютуба, которое я незадолго до этого смотрел, а проектом была дополненная реальность на юнити. Там сервисы делают всё за тебя, надо только потратить время на настройку. Тут, уверен, абсолютно такая же история: скачал одно, скачал другое, совместил - готово.
А ну ок, у меня вопросов больше нет
Больше всего меня удивляет, что сначала люди строят теории заговора и бросаются оскорблять незнакомых людей, а потом переход на "искать по дворам".
Ну ... пропагандируйте вечное, уважайте золотое правило морали, будьте в душе гуманистами / буддистами / коммунистами (кому что по душе) и все будет ок.
Логика вежливости в духе дикого запада или банально возможность ответить за слова - тоже ок.
Так ты первый перешёл на оскорбления, аллё. Ты бревно то из глаза достань!
Интересно это модерация всё-таки пришла или автор совсем уже написал что-то неадекватное.