{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Alexander Veysov

5 ноя 2021 5.11.2021

Бесплатное распознавание речи для всех желающих

После относительно недавнего релиза мы сделали наше распознавание речи бесплатным для всех индивидуальных пользователей на страничке по адресу — https://audio-v-text.silero.ai/.

Да, вы не ослышались. Это не шутка, не очередная кампания по продаже "шпионских" гаджетов, не альтруизм и не обман:

Да, сервис сделан для простых людей, и там есть разумные ограничения на объем, перепродавать не получится (а если у кого-то получится, то нам придется или закрутить все сильнее, или закрыть сервис).
Да, мы предприняли разумные меры, чтобы сделать все безопасным как для нас, так и для пользователей.
Да, этот сервис будет бесплатным.
Да, мы полностью независимы и никак не аффилированы с теми самыми компаниями (если вы понимаете, о чем я).

Как Пользоваться

Инструкция простая до банальности:

зайти на страничку,
опционально попробовать демку с микрофоном,
залить свой файл в формочку,
получить распозанный файл на email.

По идее должно работать во всех основных браузерах. Рекомендуется заходить с ноутбука или десктопа, но и со смартфона в принципе тоже должно работать.

Не лишним будет упомянуть: правильно указывая, из какого домена (какого типа) ваше аудио, вы поможете повысить качество распознавания вашего аудио.

Идея Сервиса

Если сейчас обычному физическому лицу нужно что-то транскрибировать, то на рынке есть опции:

Есть решения, требующие регистрации, оплаты, создания личного кабинета.
Есть ограниченное количество корпоративных решений, которые, по очевидным причинам, тоже не закрывают этот случай.
Есть большое количество ML репозиториев, устаревших решений или поделок народных "умельцев". Но "обычный" пользователь вряд ли может ими воспользоваться.

Резюмируя: нет качественных решений для "маленьких"/одноразовых случаев использования (без геморроя и высокого порога входа). Мы решили это исправить. Будем признательны за вашу конструктивную обратную связь.

Текущие Ограничения

У сервиса в текущем виде есть ряд ограничений, часть которых решается технологически, а часть только процессуально:

Хотя мы можем разделять заранее известное количество говорящих, это не вошло в MVP сервиса.
Многоканальное аудио в MVP не разделяется и обрабатывается после усреднения каналов.
Наличие большого количества жаргона, англицизмов или очень редкой уникальной лексики негативно влияет на распознавание. Конечно это решается, но скорее уже в рамках отдельного проекта или с помощью ручной пост-обработки.
Чем лучше качество исходного аудио, тем лучше качество транскрибации.
На данный момент пунктуация и заглавные буквы автоматически в сервисе не проставляются, хотя мы в это умеем.
Для некоторых случаев, даже при хорошем качестве аудио и с учетом автоматической простановки знаков препинания, нужна пост-обработка людьми. Мы пока не предлагаем такой сервис.

Безопасность и Использование Данных

Мы используем лучшие из доступных нам инструментов. Мы шифруем трафик и данные. Мы блокируем ботов и пресекаем нецелевое использование.

Для любителей разоблачений и теорий заговора: основной целью сервиса является улучшение качества распознавания в конкретных доменах с использованием данных пользователей. По этой причине просим всех пользователей прочитать оферту и убедиться, что все посылаемые данные не содержат чувствительной или запрещенной информации. Мы не будем публиковать или делиться этими данными с третьими сторонами, но, естественно, подходите к своим и чужим данным ответственно и используйте сервис на свой страх и риск.

30 показов

4.9K открытий

87 комментариев

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Angel Vivaldi

6.11.2021

Незрелость автора и его неумение принимать критику летя с шашкой на гало с минусами смешит. Уважаемый разработчик, с таким подходом вы никогда не сделаете нормальный сервис, потому что сервис это в первую очередь общение с клиентами и принятие критики, одному не нравится тут, другому в ином месте (:

Ответить

Развернуть ветку

Роман Рабочий

7.11.2021

Ну он по крайней мере что то делает, и его продукт довольно серьезная штука.
Написать статью здесь и работать с комментариями, это не просто.
Пробовали?
С первого раза все круто получилось?

Ответить

Развернуть ветку

Alexander Veysov

7.11.2021 Автор

Я совсем недавно стал пробовать Пикабу и VC как альтернативные площадки для популяризации нашей работы и мягко говоря удивился уровню токсичности. Но так сказать средней, а не медианной (это очень важно).

Если на Хабре, несмотря на его известную токсичность, профессиональные тролли сразу попадают в пермабан (например за мат), то тут я уже видел пару таких персонажей. Сотни - тысячи комментов, все на статьях абсолютно разной тематики, все кого-то пытаются унизить, иногда опускаясь до оскорблений в духе ad hominem и прямого мата. И при этом положительная карма (!).

Понятно, что это некий симбиоз ценностей "редакции", выраженный в том, как работает продукт и публики, которую он привлек. Больше хейта => больше трафика.

Я всегда старался не "читать советских газет", но следующие факты меня повергли в шок при беглом просмотре популярных статей:

- За мат, прямые и непрямые оскорбления юзеры и переход на личности не получают инстант бан (тот же Хабр бессмысленно жесток, но там есть подобие неких неписанных правил, и только в определенных хабах они совсем неадекватные);

- Модерация сайта отсутствует или не работает (или спит). Ну или как вариант не справляется или такое в порядке вещей;

- Сайт способствует хейту показывая кто на что поставил какие оценки в реальном времени;

- Даже под этой статьей появился персонаж с интересной историей - тонна залайканных хейтерских комментов и тонна слитых. В целом карма очень позитивная. Юмор состоит в том, что в ответ на то, что я поставил дислайки его самым неадекватным комментариям, он стал минусовать вообще все мои комментарии на сайте и параллельно выставлять себя жертвой;

Откровенно говоря, я думал, что Хабр токсичен, но сейчас я понимаю, что это цветочки.

Ответить

Развернуть ветку

Александр Трофимов

7.11.2021

Токсичный тут ты. Ты первым перешёл на личности, сказав, что пользоваться вк - себя не уважать. А потом ещё и не аргументировал свою точку зрения, когда я спросил че за фигня. Ты просто убежал плакать.
Реально жаль, что ты не получил инстант бан за это оскорбление. Ещё и лицемеришь тут, мол ты один д'артаньян.
И даже не пробуй о своей бесполезной, неудобной и заранее устаревшей приложухе говорить в реале. А то получишь аргументированный контраргумент, начнёшь оскорблять, а тебе по роже надают (и правильно сделают)...

Ответить

Развернуть ветку

Angel Vivaldi

7.11.2021

У меня 2 своих сервиса, я каждый день работаю с клиентами, я прекрасно знаю что нужно держать себя в руках, а не вот эти все истерики

Ответить

Развернуть ветку

Роман Рабочий

7.11.2021

Именно поэтому вы не используете тут реальное имя и фамилию?

Ответить

Развернуть ветку

Angel Vivaldi

7.11.2021

Какая связь? Я обязан это делать? Я скорей переживаю что такие люди как ТС зная мои имя и фамилию, примерное место проживания и что-то еще, начнут выходить за рамки данного поста, я же не знаю меру "отбитости" ТСа, сегодня он минусит за высказывание которое ему не понравилось, а завтра пойдет искать меня по дворам (:

Ответить

Развернуть ветку

Александр Трофимов

7.11.2021

Я пробовал. Выступать вживую - вот где страшно и нет гугла. А комменты - это хрень. И уж тем более я никогда никому не говорил, что оппонент себя не уважает, если он пользуется популярными вещами.
И откуда вы знаете что его проект серьёзен? У меня ученики пару лет назад на конкурсе были с 6-осевым роботом с компьютерным зрением, так там первое место занял проект, который повторяется по 11 минутному видео с ютуба, которое я незадолго до этого смотрел, а проектом была дополненная реальность на юнити. Там сервисы делают всё за тебя, надо только потратить время на настройку. Тут, уверен, абсолютно такая же история: скачал одно, скачал другое, совместил - готово.

Ответить

Развернуть ветку

Роман Рабочий

7.11.2021

Тут, уверен, абсолютно такая же история: скачал одно, скачал другое, совместил - готово

А ну ок, у меня вопросов больше нет

Ответить

Развернуть ветку

Alexander Veysov

7.11.2021 Автор

Больше всего меня удивляет, что сначала люди строят теории заговора и бросаются оскорблять незнакомых людей, а потом переход на "искать по дворам".

Ну ... пропагандируйте вечное, уважайте золотое правило морали, будьте в душе гуманистами / буддистами / коммунистами (кому что по душе) и все будет ок.

Логика вежливости в духе дикого запада или банально возможность ответить за слова - тоже ок.

Ответить

Развернуть ветку

Александр Трофимов

10.11.2021

Так ты первый перешёл на оскорбления, аллё. Ты бревно то из глаза достань!

Ответить

Развернуть ветку

Alexander Veysov

7.11.2021 Автор

Комментарий скрыт

Интересно это модерация всё-таки пришла или автор совсем уже написал что-то неадекватное.

Ответить

Развернуть ветку

Показать 87 комментариев . Вы видите только часть дискуссии

Написать комментарий...

84 комментария

Раскрывать всегда