{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Бесплатное распознавание речи для всех желающих

Бесплатное распознавание речи для всех желающих

После относительно недавнего релиза мы сделали наше распознавание речи бесплатным для всех индивидуальных пользователей на страничке по адресу — https://audio-v-text.silero.ai/.

Да, вы не ослышались. Это не шутка, не очередная кампания по продаже "шпионских" гаджетов, не альтруизм и не обман:

  • Да, сервис сделан для простых людей, и там есть разумные ограничения на объем, перепродавать не получится (а если у кого-то получится, то нам придется или закрутить все сильнее, или закрыть сервис).
  • Да, мы предприняли разумные меры, чтобы сделать все безопасным как для нас, так и для пользователей.
  • Да, этот сервис будет бесплатным.
  • Да, мы полностью независимы и никак не аффилированы с теми самыми компаниями (если вы понимаете, о чем я).

Как Пользоваться

Инструкция простая до банальности:

  • зайти на страничку,
  • опционально попробовать демку с микрофоном,
  • залить свой файл в формочку,
  • получить распозанный файл на email.

По идее должно работать во всех основных браузерах. Рекомендуется заходить с ноутбука или десктопа, но и со смартфона в принципе тоже должно работать.

Не лишним будет упомянуть: правильно указывая, из какого домена (какого типа) ваше аудио, вы поможете повысить качество распознавания вашего аудио.

Идея Сервиса

Если сейчас обычному физическому лицу нужно что-то транскрибировать, то на рынке есть опции:

  • Есть решения, требующие регистрации, оплаты, создания личного кабинета.
  • Есть ограниченное количество корпоративных решений, которые, по очевидным причинам, тоже не закрывают этот случай.
  • Есть большое количество ML репозиториев, устаревших решений или поделок народных "умельцев". Но "обычный" пользователь вряд ли может ими воспользоваться.

Резюмируя: нет качественных решений для "маленьких"/одноразовых случаев использования (без геморроя и высокого порога входа). Мы решили это исправить. Будем признательны за вашу конструктивную обратную связь.

Текущие Ограничения

У сервиса в текущем виде есть ряд ограничений, часть которых решается технологически, а часть только процессуально:

  • Хотя мы можем разделять заранее известное количество говорящих, это не вошло в MVP сервиса.
  • Многоканальное аудио в MVP не разделяется и обрабатывается после усреднения каналов.
  • Наличие большого количества жаргона, англицизмов или очень редкой уникальной лексики негативно влияет на распознавание. Конечно это решается, но скорее уже в рамках отдельного проекта или с помощью ручной пост-обработки.
  • Чем лучше качество исходного аудио, тем лучше качество транскрибации.
  • На данный момент пунктуация и заглавные буквы автоматически в сервисе не проставляются, хотя мы в это умеем.
  • Для некоторых случаев, даже при хорошем качестве аудио и с учетом автоматической простановки знаков препинания, нужна пост-обработка людьми. Мы пока не предлагаем такой сервис.

Безопасность и Использование Данных

Мы используем лучшие из доступных нам инструментов. Мы шифруем трафик и данные. Мы блокируем ботов и пресекаем нецелевое использование.

Для любителей разоблачений и теорий заговора: основной целью сервиса является улучшение качества распознавания в конкретных доменах с использованием данных пользователей. По этой причине просим всех пользователей прочитать оферту и убедиться, что все посылаемые данные не содержат чувствительной или запрещенной информации. Мы не будем публиковать или делиться этими данными с третьими сторонами, но, естественно, подходите к своим и чужим данным ответственно и используйте сервис на свой страх и риск.

0
87 комментариев
Написать комментарий...
Julius Koivu

Вы пишете: "Резюмируя: нет качественных решений для "маленьких"/одноразовых случаев использования (без геморроя и высокого порога входа)"
Есть: VK. Сам себе записываешь голосовое сообщение и там же в текст конвертится.
Но где лучше не берусь утверждать, т.к. пользовался только VK - мне хватает короткие путевые заметки делать.
Но Вам спасибо за бесплатный сервис и удачи в деле :)!

Ответить
Развернуть ветку
Alexander Veysov
Автор

Тут много противоречивых философских, идеологических и технологических моментов. Давайте по пунктам:

(0) Продуктовый момент - мы специально работаем и будем улучшать работу именно с длинными файлами. ВК скорее всего будет фокусироваться на коротких;

(1) У меня нет аккаунта ВК (я вообще считаю, что каждый уважающий себя человек, не должен сидеть в этих маркетинговых помойках - есть мессенджеры же);

(2) Недавние события показывают что соцсети стремятся к абсолютному злу. А у нас еще это конгломерат, созданный понятно кем на основе враждебного поглощения. Короче все претензии к FB + русские олигархи + mail.ru;

(3) Соцсети не поддерживают основные принципы интернета - заменимость и открытость и стремятся залочить все на себя. Простыми словами - они поддерживают интересы агрессивного капитала и долгосрочно античеловечны;

(4) Вставить нужную статистику про уголовные сроки за репост и палочную систему;

Мне лично было достаточно и части из этих пунктов, чтобы перестать пользоваться социальными сетями в районе 2015 года.

Ответить
Развернуть ветку
Julius Koivu

Ну, про соц.сети и приведенные Вами доводы ими не пользоваться, с удовольствием подискутировал бы :) А так, в целом, согласен. Как минимум да, разный формат: в ВК - так, быстро на ходу/за рулём что-то накидал, скопировал. У Вас же можно целые встречи/телефонные разговоры в текст переводить: зашел, загрузил, получил - проще простого. Проголосовать за статью, простите, не могу, минусовая карма не позволяет, поэтому просто повторюсь: Вам спасибо за бесплатный сервис и удачи в деле :)!

Ответить
Развернуть ветку
Александр Трофимов

Уверен, этот сервис бесплатный до тех пор, пока им не заинтересуется большое количество людей и его не получится монетизировать, после чего он скатится в "маркетинговую помойку".

Ответить
Развернуть ветку
Александр Трофимов

Ну заебись. Я теперь себя не уважаю, получается? И что мне, всё фоточки, заметочки, файлики, которые я делал ещё во времена, когда вк был топ выкачивать оттуда и перемещать в телегу? И ещё всех всех знакомых заставлять пересаживаться на телегу, а с теми, кто не хочет - обрывать связь?
Можно подставить вместо телеги любой мессенджер, кроме ватсаппа, ибо он урезанная телега (точнее наоборот по хронологии - телега усовершенствованный ватсап, но не суть). А стоп. Других-то мессенджеров и нет...

С чего ты уверен, что телега про тебя ничего не сливает фсбшникам и рекламодателям? Рекламу, кстати, завезли в телегу вот вот.
Шапочку из фольги сними, нафиг ты никому не сдался.

Ответить
Развернуть ветку
Angel Vivaldi

Где гарантия что он со своим сервисом не начнёт сливать через полгодика нормальной работы ((:

Ответить
Развернуть ветку
Александр Трофимов

Я аналогичное где-то ниже написал. И деньги начнёт рубить и данные сливать, как только серверные мощности перестанут расходоваться на хобби больше, чем на реальную работу. Все так поступают. У меня аналогично есть купленный хост с доменом на 5 лет вперёд (для разработки и домашних умных самодельных девайсов), и если я буду выкатывать на него какой-то проект, который будет жрать не по моим нуждам процессорное время, я в первую очередь буду просить донаты, а если их будет не хватать - буду делать сервисную архитектуру.

Ответить
Развернуть ветку
84 комментария
Раскрывать всегда