Форум Альфа-Банка про диджитал
До начала осталось:
Узнать
Трибуна
Денис Чернышев
94 760

Бот для Telegram, который преобразовывает голосовые сообщения в текст

Голосовые сообщения это удобно, но как правило, только для отправителя. Ведь далеко не всегда эти сообщения удобно слушать. На работе, за рулем автомобиля, или же просто шумная обстановка вокруг.

В закладки

Мне захотелось раз и навсегда решить эту проблему, и я написал бота для Telegram, который преобразовывает голосовые сообщения в текст.

Вы можете добавить его в любой чат, и все голосовые сообщения бот будет автоматически преобразовываться в текст:

Если нет желания добавлять бота в чат, то можете сохранить его в контактах, и по необходимости пересылать ему сообщения, а в ответ получать текстовые расшифровки:

А если среди ваших контактов нет любителей голосовых сообщений, то можете просто надиктовывать боту сообщения, и использовать их как “записную книжку”:

Добавить бота себе можно по ссылкам:

Объявление на vc.ru Отключить рекламу

Если не получилось открыть по ссылке, то в приложении Telegram ищите в поиске по имени: @VoiceMsgBot

{ "author_name": "Денис Чернышев", "author_type": "self", "tags": [], "comments": 65, "likes": 39, "favorites": 52, "is_advertisement": false, "subsite_label": "tribuna", "id": 86795, "is_wide": false, "is_ugc": true, "date": "Sat, 12 Oct 2019 15:39:51 +0300", "is_special": false }
Объявление на vc.ru Отключить рекламу
0
65 комментариев
Популярные
По порядку
Написать комментарий...
33

А мой https://t.me/voicybot поддерживает 3 движка распознавания речи на выбор, более 80 языков, распознает любые аудиофайлы и не имеет ограничения в 20мб по размеру файла для распознавания на https://voicybot.com. А, ну и пользуются и доверяют ему уже более 2 000 000 людей. Ну эт я так, для справки. А ещё у него код открыт: https://GitHub.com/backmeupplz/voicybot. Автор, можете воспользоваться ;)

Ответить
3

Конкуренция - двигатель прогресса ;)

Ответить
3

А еще лучший двигатель прогресса — кооперация. Всегда можно улучшить уже существующее опен-сурс решение и закинуть пулл-реквест, чтобы всем пользователям сразу стало лучше :) На этих ботах все равно никак не заработать — смысл обременять себя ненужными серверными тратами, когда другие люди уже берут их на себя?

Ответить
3

Правильная ссылка на Гитхаб: https://github.com/backmeupplz/voicy

Ответить
1

Чьорт, сам забыл уже свои урлы репозиториев, спасибо, что поправили!

Ответить
2

Честь Вам и хвала за войсибота!

Ответить
0

Автор поста банально не изучил существующие решения. Это грубое упущение.

А вообще, у меня давно была идея (ещё до появления Telegram) сделать что-то похожее для телефонных звонков. Но сделалось вот что. И да, я тебе рассказывал как-то про свой проект. Жду всех в гости :).

Ответить
0

Сделал share аудиозаписи из whatsapp - не сработало :(

Ответить
1

Включите /files :)

Ответить
0

Алсо, недавно вышел гугл дуплекс :) у меня все входящие автоматически теперь говорят с гуглоассистентом, а поднимаю трубку я только когда что-то важное вижу.

Ответить
0

Никита, а как преобразовать звуковые файлы из записей АТС менеджеров отдела продаж для дальнейшего анализа?

Ответить
0

Либо включите у @voicybot распознавание файлов командой /files (можете еще /silent отключить) и кидайте ему голосовые сообщения в Телеграме (до 20мб), либо на voicybot.com распознавайте любого размера аудио файлы.

Ответить
0

Комментарий удален по просьбе пользователя

Ответить
0

А на базе чего распознаёт? Амазон, Яндекс? Дорого выходит? За распознавание голоса довольно кусачие тарифы на сколько помню:/

Ответить
0

Wit бесплатный, Google Speech можно настроить и платить по $0.006 за 15 секунд, Nanosemantics ребята недавно написали и я их добавил — пока не просят денег :)

Ответить
0

А у wit разве нет лимита 15-20 сек за одно обращение? Он умеет длинные аудио распознавать?

Ответить
0

Войси автоматически бьёт на интервалы в 15-20 секунд :)

Ответить
0

Я просто в доке нашёл только метод POST/speech и GET/speech которые принимают по 20 сек файлы:) Ещё есть Streaming audio, но как я понял сам он не умеет на куски резать и надо ему по 10 сек скармливать файлы, и подумал что такое не пойдёт:/ или там ещё как то можно?

Ответить
0

Войси автоматически бьёт на интервалы в 15-20 секунд :)

Ответить
0

А если обрежет на середине слова? Тогда ж криво распознает по идее, нет?

Ответить
0

Лучшп, чем без распознавания вовсе :3

Ответить
0

Там ещё есть Streaming audio, по идее он как раз позволяет избежать этих склеек, отправляя по 10 сек кусочки файла и в режиме реального времени возвращает текст, или это не так работает?🤔

Ответить
0

Wit так не умеет.

Ответить
24

Для любителей голосовых сообщений в аду отдельный котёл. 
По соседству с любителями портативных переносные колонок. 

Ответить
2

И по поводу голосовых - я их просто удаляю. ;) Слушаю крайне редко. И всегда пишу новым собеседникам, что записи мне слушать неудобно, некогда и так далее.
Если у них времени на меня нет, то у меня - тем более.

Ответить
0

Не, колонки - это тема, их просто неправильно используют. Я, например, купил себе несколько колонок, таскаю по участку рядом с домом, и слушаю любимый музон - кому это мешает? Да никому. Сосед, вон, радио слушает - мне не мешает, далеко всё-таки.

Когда же колонку тащат за собой по улице - это зашквар.

Ответить
1

Ну я как раз про уличных таскателей. На участке или даче, конечно, самое то-) 

Ответить
0

единственное исключение - люди на велосипедах, имхо. Так их сзади слышно. И они быстро проезжают дальше

Ответить
6

Лично я хочу фишку игнора голосовых.
Очередной #@# отправляет тебе голосовое, а ему автоматически в ответ "этот пользователь запретил получение голосовых сообщений".

Слишком много чести - распознавать! Значит, собеседник тебя не уважает, не бережёт твое время, а ему что-то должен?

Ответить
3

Оооо даааа! Считаю вежливым, если перед этим спрашивают: «Можно я войс пришлю? Или напишу, но попозже». Если мне ок, то можно.
Я слушаю войсы от подруг. И всё. Понятно, что проще высказать мысль, да и мне приятно её послушать.

А по работе — тоталли нет. Потом ещё и хрен найдёшь нужную инфу, а тебе потом «Ну я же записывал войс, ну чо ты». А я визуал, запоминаю ТОЛЬКО то, что читаю глазами. Все аудио — мимо моего внимания 100%

Ответить
1

Да, это очень удобная фича, особенно радуют заказчики дающие техзадание в виде войсмэйлов. На 10 минут

Ответить
0

а телефонные звонки вы тоже не любите?
или речь касается только записи, не живого разговора?

Ответить
0

Только записи, разумеется. Звонки я люблю, потому что связь двусторонняя.

Ответить
6
Ответить
1

Эта картинка дожна каждый раз всплывать при попытке отправить голосовое сообщение в каждом мессенджере

Ответить
5

Ещё один бот. Распознающий голосовые сообщения в текст.

Зачем?
У всех остальных критический недостаток?

Ответить
–2

Отлично! Я буду пользоваться, часто записываю аудио тк нет времени писать текст (сказать быстрее).

Ответить
11

А с чего Вы решили, что у собеседника будет время слушать голосовые сообщения?!
Я не понимаю - у Вас, значит, времени нет, а на время собеседника пофигу? Это как?

п.с. проблема не в том, что не времени, а в том что когти длинные и русский хромает - отсюда и популярность голосовых.

Ответить
–1

У Вас странные аргументы!
Если Вам записывают 2-х минутное аудио и 1,5 минуты из них эээ-кают .. я Вам сочувствую! Я же записываю лаконичные и краткие аудио, в случаях, когда мне действительно неудобно.. и мои собеседники/сотрудники/партнеры не против)
Единственное, в чем я вижу недостаток- не всем удобно сразу прослушать аудио, в этом может помочь Денис со своим ботом!
По-моему, удобно)

Ответить
13

Понимаете, Инга, прочитать сообщение можно за пару секунд, уловить основной смысл. Понять, важно это, или просто прикол.

Голосовое же нужно прослушать от и до. И желательно в тихой располагающей обстановке.

Если, допустим, я еду за рулём, какая реакция будет на голосовое сообщение?
Или, что намного чаще, я просто занят. Втыкаю в комп и решаю задачу. Вдруг - уведомление "сервер лежит!". Сообщение важное, нужно всё бросить и помочь клиенту.
Напротив, голосовое сообщение на 7 секунд. Да я даже не прервусь из-за текущей задачи! Хрен его знает, что там - пожелание здоровья или проблема.

Поэтому я считаю голосовые сообщения неуважением к собеседнику. У вас-то удалось его записать, но удастся ли собеседнику его внимательно прослушать? Большой вопрос.

Голосовые я иногда слушаю. Но вечером, после работы. Вам удобно их записывать, а мне их удобно слушать вечером. Паритет.

Ответить
4

Плюс по голосу нет поиска, что иногда удобно в будущем

Ответить
1

В Ваших словах есть правда, и да, прослушивать не всегда удобно или приятно !
Но выбор каждого пользоваться данной услугой или нет. Я уверена, в Вашем случае, клиенты/ сотрудники/друзья знают о Вашем отношении к аудио, но это не значит, что оно НЕ подходит всем.

Ответить
3

Что значит - "пользоваться данной услугой или нет"?
Мне присылают голосовые - что мне делать, если я не могу тут же их прослушать?

Просто рекомендую никому не отправлять голосовые сообщения - попадётся такой же занятый человек - и будут проблемы.
Уважайте собеседника, и он ответит тем же.

Наверное, видите, какие я тут пишу тексты, длинные и понятные. Такие же я пишу в мессенджерах. Мне проще чётко написать собеседнику, что необходимо, выделить основную тему, а не использовать голосовые.

Честно напишу, что я никогда не использовал голосовые как исходящие. Я понимаю всецело, что человек может быть занят. Что ему "прямщас" не удобно ответить. Именно поэтому в качестве средства коммуникации я обожаю электронную почту, email - ты просто пишешь когда удобно, а тебе отвечают, когда им удобно.

p.s. мне набить длинный текст не западло. я уважаю русский язык, равно как и любой другой, могу набить такую же простыню на инглише и на дойче. каждый свой текст я набиваю так, чтобы меня понял собеседник.

Ответить
0

В машине как раз удобнее нажать один раз воспроизведение и слушать, чем читать, и раз человек потратил время на запись голосового сообщения, значит он вас все таки уважает, а прослушать это сообщение займет ровно то же время, что и его запись

Ответить
0

Я не знаю, как Вы читаете, может, по слогам, а я читаю по диагонали.
Когда видишь текст размером даже во весь экран, глаза быстро пробегаются, и находят ключевые фразы - на это нужны доли секунды!
А дальше либо приступаешь к решению проблемы, либо пропускаешь до более подходящего момента.

Это намного удобнее и быстрее, чем опусы ни о чём слушать несколько минут, пытаясь услышать, что там конкретно рассказали.
Потому, что при отправке голосовых человек не слышит собеседника, его никто не исправляет - и сообщение забивается посторонними звуками, и даже звуками того, кто отправляет. Сопение, пыхтение, кашель, выдох дыма сигареты - список можно продолжать.

Ответить
0

Уважаемый, по слогам дети читают, а отвлекаться от дороги находясь за рулем не советую даже на пару секунд. Боком вам выйдет однажды чтение "опусов ни о чём" даже по диагонали.

Ответить
0

Я никогда не отвлекаюсь от дороги, это плохая привычка. Для звонков есть BT, а чтобы взглянуть на уведомления, достаточно остановки перед светофором.

Если же там будут голосовые, а не текст, я много времени после старта потрачу. Да ещё напрягайся, разбирай, что там хотели сказать.

Текстовое же уведомление с проблемой - это повод остановиться на обочине.

Ответить
4

Без регистрации и смс слить все свои разговоры рандомному чуваку который сделал бота 🤫

Ответить
2

надо ии подключить, шоб одно сообщение на час сокращал до 5 секунд и выдавал всю суть без воды

Ответить
2

Комментарий удален по просьбе пользователя

Ответить
1

Сделайте чтобы оно автоматически показывало - не доставлено и не отправлялось повторно

Ответить
1

бот перестал работать уже пару дней

Ответить
0

Интересный бот👍

Ответить
0

Спасибо, полезно! 

Ответить
0

А он может аудио файл с диктофона преобразовать?

Ответить
0

Нет, распознавание файлов не предусмотрено. Только небольшие голосовые сообщения.

Ответить
0

Этот комментарий сделан голосовым сообщением

Ответить

Комментарий удален

0

Все эти боты ещё очень плохо справляются со своей основной задачей, попробовал - не понравилось, много ошибок

Ответить
0

Так их смысл не в этом. А в том, что вы добровольно заливаете туда тонны своих и чужих разговоров. Это как тест "введите свой e-mail и телефон и на основе ваших ФИО мы подскажем, какая вы фея Винкс", только чуть более продвинутый уровень.

Ответить
0

Эх, если бы была возможность монетизировать все эти данные, то я бы уже был миллиардером :(

Ответить
0

Мы - религиозная семья (Но телеграмом пользуемся. И не только)
Поставили себе этого бота.
А он - матерится... o_o

Ответить
0

А точно бот матерится? Он же распознает голосовые сообщения.

Ответить
0

И как диктовать знаки: ? ! :))

Ответить
0

как-то его можно в чат с человеком подключить? здравствуйте

Ответить
0

А как добавить бота в чат, а не группу (я, собеседник и бот)?

Ответить

Комментарии

null