{"id":14268,"url":"\/distributions\/14268\/click?bit=1&hash=1e3309842e8b07895e75261917827295839cd5d4d57d48f0ca524f3f535a7946","title":"\u0420\u0430\u0437\u0440\u0435\u0448\u0430\u0442\u044c \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u0430\u043c \u0438\u0433\u0440\u0430\u0442\u044c \u043d\u0430 \u0440\u0430\u0431\u043e\u0447\u0435\u043c \u043c\u0435\u0441\u0442\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f71e1caf-7964-5525-98be-104bb436cb54"}

Telegram-бот Silero бесплатно переводит речь в текст

Мы сделали бесплатного телеграм-бота, который переводит аудио в текст. В отличие от нашего бесплатного публичного решения для транскрибации длинных аудио, этот бот скорее настроен для удобства работы с короткими голосовыми сообщениями, заметками и аудио средней длины.

Боту можно послать аудио как напрямую, так и добавить в группу. В группе бот будет реагировать на все аудиофайлы (но сообщения об ошибках выводиться не будут). Более подробно об ограничениях и особенностях работы можно узнать в методах /help и /faq.

Основная UX фишка работы бота — проработанный и удобный формат чтения и навигации по распознанным сообщениям и заметкам (а не стена текста).

Как воспользоваться

Нужно просто пройти по ссылке или просто открыть страницу бота @silero_audio_bot в Телеграме. Затем:

  • Введите команду /start для старта;
  • /help и /faq помогут понять основные допущения и ограничения в работе;

Сразу добавлять бота в группу, до того как вы пообщались с ним лично, не надо.

Ключевые особенности и отличия от существующих решений

Сразу чтобы вы понимали — мы разрабатываем алгоритмы, а не просто перекладываем ваши персональные данные в "джейсончики" в АПИ корпораций. Все алгоритмы и разработки, участвующие в работе бота, наши собственные.

Мы гордимся тем, что:

  • Бот работает на основе наших систем детекции речи (кстати ее скоро ждет огромное обновление!), распознавания речи, простановки знаков препинания и заглавных букв;
  • Наша система распознавания как минимум не уступает решениям корпораций (вопрос дискуссионный, по нашим исследованиям на примерно 20 разных доменах наша система была лучшей на большинстве из них, кроме ряда ярких исключений, типа звонков в банки);
  • Бот "пытается" быть максимально удобным с точки зрения UX и читабельности в рамках возможностей Телеграма;

Мы НЕ делаем следующих вещей:

  • Мы НЕ собираем данные о пользователях;
  • Мы НЕ занимаемся "продажей аудитории" инвесторам или третьим лицам;
  • Мы НЕ шлем ваши данные в АПИ корпораций или компаний, аффилированных с олигархическими структурами;
  • Мы НЕ присваиваем себе чужих достижений, все наработки наши собственные;

Безопасность и ограничения

Ограничение 20 мегабайт на файл для Телеграма мы не стали снимать, потому что в нормальном аудио формате в 20 мегабайт можно уместить достаточно длинное аудио для данного UX-сценария и повторюсь, что есть отдельный сервис для "длинных" аудио, который будет развиваться отдельно. С точки зрения удобства пользователя странно в мессенджере решать десктопные юзкейсы.

У каждого пользователя есть лимит, мы блокируем ботов и пресекаем нецелевое использование доступными нам методами.

Мы полностью шифруем весь трафик и данные. Мы не "дарим" ваши персональные данные корпорациям или олигархическим (или аффилированным с ними) структурам.

Дальнейшее развитие

Так же, как и наше решение для транскрибации длинных файлов, мы будем развивать и улучшать наше решение, если оно будет полезно народу. В каком-то смысле судьба бота и наличие независимого инструмента в ваших руках.

Мы постарались сделать все по красоте, но если будут какие-то баги и проблемы, мы будем благодарны комьюнити за помощь. В первое время возможны небольшие перебои с работой при раскатке фиксов, но мы надеемся, что мы уже отладили 95% всех краевых случаев, а оставшиеся 5% можно будет быстро поправить или понять и простить.

Мы уже нашли и поправили ряд краевых случаев, мы стараемся оперативно вносить их в /faq.

0
140 комментариев
Написать комментарий...
Гаджимурад Магомедрасулов

а куда делся Voicy

Ответить
Развернуть ветку
borodutch

Все еще есть, не успел прикрутить Silero к себе!

Ответить
Развернуть ветку
Alexander Veysov
Автор

Мы общались с его автором полтора года назад, но дело с тех пор особо не сдвинулось.

Не так давно также выяснилось (автор даже сам пишет об этом в своем блоге), что он продает данные своих пользователей или "аудиторию" инвесторам. Что напрямую противоречит нашим ценностям и идеологии.

По этой причине мы решили не плодить зависимости и просто сделать бота самим. Благо для коллег с опытом создания ботов это буквально дело нескольких дней работы (оттестировать все краевые кейсы и сделать нормальный UX сложнее, но сейчас кажется остался только один такой важный кейс).

И тот факт, что все технологии здесь наши и мы не просто передаём json из одного АПИ в другое, процесс упрощает на порядок. Так что как обычно - мой посыл поддерживайте производителя а не middleware)

Ответить
Развернуть ветку
borodutch

Александр, "автор" тут. Ну зачем же вот так открыто врать?

что он продает данные своих пользователей или "аудиторию" инвесторам.

Ни копейки с Voicy я так и не заработал — кому продаю? Кто мои инвесторы, кроме меня самого? Откуда вы понабрали этого?

Ответить
Развернуть ветку
Alexander Veysov
Автор
Ответить
Развернуть ветку
borodutch

Алло! Там черным по белому написано "rejected". Я наоборот *отказался* от оффера продажи — и именно по этическим причинам.

Ответить
Развернуть ветку
Alexander Veysov
Автор

С одной стороны, можно сказать, что мне раза три что-то такое поедлагали и я отказывался. И в принципе бессмысленно говорить о том, что не случилось.

Но я предпочитаю не писать о таком, это противоречит моим принципам и будет воспринято понятно как.

С другой - все мы вроде не маленькие дети и не вчера родились, и очевидно зачем пишутся такие посты и какие цели они преследуют.

Ответить
Развернуть ветку
borodutch

Я не продал — плохой. Вы не продали — хороший. Крутая риторика.

Ответить
Развернуть ветку
Alexander Veysov
Автор

Чтобы не говорить без пруфов внесу корректировку.

Не продает, а находится в процессе / рассматривает опции продажи.

Но это само по себе означает принятия правил игры.

Ответить
Развернуть ветку
borodutch

Не вижу корректировки в оригинальном сообщении. Говорите прямо: что за игра и что в ней за правила? И с чего вы взяли, что я их принял?

Ответить
Развернуть ветку
Alexander Veysov
Автор

Это скатывается в бессмысленную риторику.

Тренды глобальные и понятные, маргинализация науки и образования, размывание норм социального государства, примат интересов капитала и общества потребления.

При отсутствии конкуренции со стороны классического конкурента в виде социалистической системы, капитал распрясывается. Формируется биполярный мир, но уже с Китаем. На фоне этого бесконечный системный кризис нашей модели вследствие постоянного негативного сальдо по капиталу приводит к все более диким проявлениям этого самого купи продай.

Мой постулат состоит в том, что если открыто и публично постулируется участие в переговорных процессах - то правила игры приняты и преследуются понятные хрестоматийные цели.

Мысли читать я не умею, в постулирование благих намерений с помощью слов, а не действий, верю мало.

Ответить
Развернуть ветку
borodutch

Проблема в том, что вы еще и действия игнорируете, когда они не вписываются в вашу картину мира.

Я отказался от $600K за Войси по причине желания покупателя неэтично пользоваться данными. Но это действие, конечно, вы просто игнорируете, ведь оно не вписывается в вашу риторику "все вокруг плохие, кроме меня".

Ответить
Развернуть ветку
Alexander Veysov
Автор

Доказывать наличие чего-то отсутствием чего это классический трюк, не имеющий ничего общего с материалистической картиной мира.

Отрицание лжи это правда. Но так можно доказать например существование невидимых розовых летающих слонов. Их никто не видел, но они же невилимые! Суслика не видно, но он есть.

Было бы занятно, если бы допустим реальные вопросы решались так. Докажите свою невиновность. Но наши свидетели не видели, что вы не делали ничего плохого.

Поэтому любые серьезные вещи судят по положительным документированным фактам. Стороны договорились, вот мотивация, вот пруфы.

А вот другие вещи бросаются в глаза.

Ответить
Развернуть ветку
borodutch
Докажите свою невиновность.

Блин, вроде как, серьезный человек, создал Silero, а настолько неадекватно рассуждает. Думаю, на этом диалог можно закончить.

Ответить
Развернуть ветку
Alexander Veysov
Автор

Я могу написать более нуля статей о том как я классно отказался от сделки, где наши технологии бы использовались неправильно. И за руку поймать нельзя - я же отказался! А вдруг кто-то хотел заплатить много денег? Но я же герой - отказался! Не проверите же никак, все под NDA!

Но я этого не делаю, потому что это противоречит принципам рационального мышления и будет воспринято публикой негативно.

А вот писать статьи про текущую капитализацию миддлверного проекта сдабривая virtue signalling-ом это уже позитивные факты. Это случилось, есть пруф. Вы находясь в трезвом уме и памяти сделали это.

И презумпцией невиновности это вообще не имеет ничего общего.

Если коротко - факты => мотивации => экономическая логика. А не домыслы и доказательство через отрицание несуществования.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Роман Рабочий

Странная история, у одного хороший бот, у другого хороший движок.
Но нет, не договорились, и судя по всему никогда не договоритесь)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
137 комментариев
Раскрывать всегда