Telegram-бот Silero бесплатно переводит речь в текст

Мы сделали бесплатного телеграм-бота, который переводит аудио в текст. В отличие от нашего бесплатного публичного решения для транскрибации длинных аудио, этот бот скорее настроен для удобства работы с короткими голосовыми сообщениями, заметками и аудио средней длины.

Боту можно послать аудио как напрямую, так и добавить в группу. В группе бот будет реагировать на все аудиофайлы (но сообщения об ошибках выводиться не будут). Более подробно об ограничениях и особенностях работы можно узнать в методах /help и /faq.

Основная UX фишка работы бота — проработанный и удобный формат чтения и навигации по распознанным сообщениям и заметкам (а не стена текста).

Как воспользоваться

Нужно просто пройти по ссылке или просто открыть страницу бота @silero_audio_bot в Телеграме. Затем:

  • Введите команду /start для старта;
  • /help и /faq помогут понять основные допущения и ограничения в работе;

Сразу добавлять бота в группу, до того как вы пообщались с ним лично, не надо.

Ключевые особенности и отличия от существующих решений

Сразу чтобы вы понимали — мы разрабатываем алгоритмы, а не просто перекладываем ваши персональные данные в "джейсончики" в АПИ корпораций. Все алгоритмы и разработки, участвующие в работе бота, наши собственные.

Мы гордимся тем, что:

  • Бот работает на основе наших систем детекции речи (кстати ее скоро ждет огромное обновление!), распознавания речи, простановки знаков препинания и заглавных букв;
  • Наша система распознавания как минимум не уступает решениям корпораций (вопрос дискуссионный, по нашим исследованиям на примерно 20 разных доменах наша система была лучшей на большинстве из них, кроме ряда ярких исключений, типа звонков в банки);
  • Бот "пытается" быть максимально удобным с точки зрения UX и читабельности в рамках возможностей Телеграма;

Мы НЕ делаем следующих вещей:

  • Мы НЕ собираем данные о пользователях;
  • Мы НЕ занимаемся "продажей аудитории" инвесторам или третьим лицам;
  • Мы НЕ шлем ваши данные в АПИ корпораций или компаний, аффилированных с олигархическими структурами;
  • Мы НЕ присваиваем себе чужих достижений, все наработки наши собственные;

Безопасность и ограничения

Ограничение 20 мегабайт на файл для Телеграма мы не стали снимать, потому что в нормальном аудио формате в 20 мегабайт можно уместить достаточно длинное аудио для данного UX-сценария и повторюсь, что есть отдельный сервис для "длинных" аудио, который будет развиваться отдельно. С точки зрения удобства пользователя странно в мессенджере решать десктопные юзкейсы.

У каждого пользователя есть лимит, мы блокируем ботов и пресекаем нецелевое использование доступными нам методами.

Мы полностью шифруем весь трафик и данные. Мы не "дарим" ваши персональные данные корпорациям или олигархическим (или аффилированным с ними) структурам.

Дальнейшее развитие

Так же, как и наше решение для транскрибации длинных файлов, мы будем развивать и улучшать наше решение, если оно будет полезно народу. В каком-то смысле судьба бота и наличие независимого инструмента в ваших руках.

Мы постарались сделать все по красоте, но если будут какие-то баги и проблемы, мы будем благодарны комьюнити за помощь. В первое время возможны небольшие перебои с работой при раскатке фиксов, но мы надеемся, что мы уже отладили 95% всех краевых случаев, а оставшиеся 5% можно будет быстро поправить или понять и простить.

Мы уже нашли и поправили ряд краевых случаев, мы стараемся оперативно вносить их в /faq.

0
140 комментариев
Написать комментарий...
Гаджимурад Магомедрасулов

а куда делся Voicy

Ответить
Развернуть ветку
borodutch

Все еще есть, не успел прикрутить Silero к себе!

Ответить
Развернуть ветку
Alexander Veysov
Автор

Мы общались с его автором полтора года назад, но дело с тех пор особо не сдвинулось.

Не так давно также выяснилось (автор даже сам пишет об этом в своем блоге), что он продает данные своих пользователей или "аудиторию" инвесторам. Что напрямую противоречит нашим ценностям и идеологии.

По этой причине мы решили не плодить зависимости и просто сделать бота самим. Благо для коллег с опытом создания ботов это буквально дело нескольких дней работы (оттестировать все краевые кейсы и сделать нормальный UX сложнее, но сейчас кажется остался только один такой важный кейс).

И тот факт, что все технологии здесь наши и мы не просто передаём json из одного АПИ в другое, процесс упрощает на порядок. Так что как обычно - мой посыл поддерживайте производителя а не middleware)

Ответить
Развернуть ветку
borodutch

Александр, "автор" тут. Ну зачем же вот так открыто врать?

что он продает данные своих пользователей или "аудиторию" инвесторам.

Ни копейки с Voicy я так и не заработал — кому продаю? Кто мои инвесторы, кроме меня самого? Откуда вы понабрали этого?

Ответить
Развернуть ветку
Alexander Veysov
Автор
Ответить
Развернуть ветку
borodutch

Алло! Там черным по белому написано "rejected". Я наоборот *отказался* от оффера продажи — и именно по этическим причинам.

Ответить
Развернуть ветку
Alexander Veysov
Автор

С одной стороны, можно сказать, что мне раза три что-то такое поедлагали и я отказывался. И в принципе бессмысленно говорить о том, что не случилось.

Но я предпочитаю не писать о таком, это противоречит моим принципам и будет воспринято понятно как.

С другой - все мы вроде не маленькие дети и не вчера родились, и очевидно зачем пишутся такие посты и какие цели они преследуют.

Ответить
Развернуть ветку
borodutch

Я не продал — плохой. Вы не продали — хороший. Крутая риторика.

Ответить
Развернуть ветку
Alexander Veysov
Автор

Чтобы не говорить без пруфов внесу корректировку.

Не продает, а находится в процессе / рассматривает опции продажи.

Но это само по себе означает принятия правил игры.

Ответить
Развернуть ветку
borodutch

Не вижу корректировки в оригинальном сообщении. Говорите прямо: что за игра и что в ней за правила? И с чего вы взяли, что я их принял?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
137 комментариев
Раскрывать всегда