Бот для Telegram, который преобразовывает голосовые сообщения в текст

Голосовые сообщения это удобно, но как правило, только для отправителя. Ведь далеко не всегда эти сообщения удобно слушать. На работе, за рулем автомобиля, или же просто шумная обстановка вокруг.

В закладки

Мне захотелось раз и навсегда решить эту проблему, и я написал бота для Telegram, который преобразовывает голосовые сообщения в текст.

Вы можете добавить его в любой чат, и все голосовые сообщения бот будет автоматически преобразовываться в текст:

Если нет желания добавлять бота в чат, то можете сохранить его в контактах, и по необходимости пересылать ему сообщения, а в ответ получать текстовые расшифровки:

А если среди ваших контактов нет любителей голосовых сообщений, то можете просто надиктовывать боту сообщения, и использовать их как “записную книжку”:

Добавить бота себе можно по ссылкам:

Если не получилось открыть по ссылке, то в приложении Telegram ищите в поиске по имени: @VoiceMsgBot

Материал опубликован пользователем.
Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Денис Чернышев", "author_type": "self", "tags": [], "comments": 57, "likes": 32, "favorites": 38, "is_advertisement": false, "subsite_label": "tribuna", "id": 86795, "is_wide": false, "is_ugc": true, "date": "Sat, 12 Oct 2019 15:39:51 +0300", "is_special": false }
0
{ "id": 86795, "author_id": 372982, "diff_limit": 1000, "urls": {"diff":"\/comments\/86795\/get","add":"\/comments\/86795\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/86795"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199116, "last_count_and_date": null }
57 комментариев
Популярные
По порядку
Написать комментарий...
28

А мой https://t.me/voicybot поддерживает 3 движка распознавания речи на выбор, более 80 языков, распознает любые аудиофайлы и не имеет ограничения в 20мб по размеру файла для распознавания на https://voicybot.com. А, ну и пользуются и доверяют ему уже более 2 000 000 людей. Ну эт я так, для справки. А ещё у него код открыт: https://GitHub.com/backmeupplz/voicybot. Автор, можете воспользоваться ;)

Ответить
3

Конкуренция - двигатель прогресса ;)

Ответить
3

А еще лучший двигатель прогресса — кооперация. Всегда можно улучшить уже существующее опен-сурс решение и закинуть пулл-реквест, чтобы всем пользователям сразу стало лучше :) На этих ботах все равно никак не заработать — смысл обременять себя ненужными серверными тратами, когда другие люди уже берут их на себя?

Ответить
1

Правильная ссылка на Гитхаб: https://github.com/backmeupplz/voicy

Ответить
1

Чьорт, сам забыл уже свои урлы репозиториев, спасибо, что поправили!

Ответить
1

Честь Вам и хвала за войсибота!

Ответить
0

Автор поста банально не изучил существующие решения. Это грубое упущение.

А вообще, у меня давно была идея (ещё до появления Telegram) сделать что-то похожее для телефонных звонков. Но сделалось вот что. И да, я тебе рассказывал как-то про свой проект. Жду всех в гости :).

Ответить
0

Сделал share аудиозаписи из whatsapp - не сработало :(

Ответить
1

Включите /files :)

Ответить
0

Алсо, недавно вышел гугл дуплекс :) у меня все входящие автоматически теперь говорят с гуглоассистентом, а поднимаю трубку я только когда что-то важное вижу.

Ответить
0

Никита, а как преобразовать звуковые файлы из записей АТС менеджеров отдела продаж для дальнейшего анализа?

Ответить
0

Либо включите у @voicybot распознавание файлов командой /files (можете еще /silent отключить) и кидайте ему голосовые сообщения в Телеграме (до 20мб), либо на voicybot.com распознавайте любого размера аудио файлы.

Ответить
0

Ахахах, вот ты сучара. Засрал своим voicbot'om сайт. Ну короче успехов.)) 

Ответить
0

А на базе чего распознаёт? Амазон, Яндекс? Дорого выходит? За распознавание голоса довольно кусачие тарифы на сколько помню:/

Ответить
0

Wit бесплатный, Google Speech можно настроить и платить по $0.006 за 15 секунд, Nanosemantics ребята недавно написали и я их добавил — пока не просят денег :)

Ответить
0

А у wit разве нет лимита 15-20 сек за одно обращение? Он умеет длинные аудио распознавать?

Ответить
0

Войси автоматически бьёт на интервалы в 15-20 секунд :)

Ответить
0

Я просто в доке нашёл только метод POST/speech и GET/speech которые принимают по 20 сек файлы:) Ещё есть Streaming audio, но как я понял сам он не умеет на куски резать и надо ему по 10 сек скармливать файлы, и подумал что такое не пойдёт:/ или там ещё как то можно?

Ответить
0

Войси автоматически бьёт на интервалы в 15-20 секунд :)

Ответить
0

А если обрежет на середине слова? Тогда ж криво распознает по идее, нет?

Ответить
0

Лучшп, чем без распознавания вовсе :3

Ответить
20

Для любителей голосовых сообщений в аду отдельный котёл. 
По соседству с любителями портативных переносные колонок. 

Ответить
2

И по поводу голосовых - я их просто удаляю. ;) Слушаю крайне редко. И всегда пишу новым собеседникам, что записи мне слушать неудобно, некогда и так далее.
Если у них времени на меня нет, то у меня - тем более.

Ответить
0

Не, колонки - это тема, их просто неправильно используют. Я, например, купил себе несколько колонок, таскаю по участку рядом с домом, и слушаю любимый музон - кому это мешает? Да никому. Сосед, вон, радио слушает - мне не мешает, далеко всё-таки.

Когда же колонку тащат за собой по улице - это зашквар.

Ответить
1

Ну я как раз про уличных таскателей. На участке или даче, конечно, самое то-) 

Ответить
0

единственное исключение - люди на велосипедах, имхо. Так их сзади слышно. И они быстро проезжают дальше

Ответить
5

Ещё один бот. Распознающий голосовые сообщения в текст.

Зачем?
У всех остальных критический недостаток?

Ответить
5
Ответить
0

Эта картинка дожна каждый раз всплывать при попытке отправить голосовое сообщение в каждом мессенджере

Ответить
4

Лично я хочу фишку игнора голосовых.
Очередной #@# отправляет тебе голосовое, а ему автоматически в ответ "этот пользователь запретил получение голосовых сообщений".

Слишком много чести - распознавать! Значит, собеседник тебя не уважает, не бережёт твое время, а ему что-то должен?

Ответить
2

Оооо даааа! Считаю вежливым, если перед этим спрашивают: «Можно я войс пришлю? Или напишу, но попозже». Если мне ок, то можно.
Я слушаю войсы от подруг. И всё. Понятно, что проще высказать мысль, да и мне приятно её послушать.

А по работе — тоталли нет. Потом ещё и хрен найдёшь нужную инфу, а тебе потом «Ну я же записывал войс, ну чо ты». А я визуал, запоминаю ТОЛЬКО то, что читаю глазами. Все аудио — мимо моего внимания 100%

Ответить
1

Да, это очень удобная фича, особенно радуют заказчики дающие техзадание в виде войсмэйлов. На 10 минут

Ответить
0

а телефонные звонки вы тоже не любите?
или речь касается только записи, не живого разговора?

Ответить
0

Только записи, разумеется. Звонки я люблю, потому что связь двусторонняя.

Ответить
4

Без регистрации и смс слить все свои разговоры рандомному чуваку который сделал бота 🤫

Ответить
0

Отлично! Я буду пользоваться, часто записываю аудио тк нет времени писать текст (сказать быстрее).

Ответить
9

А с чего Вы решили, что у собеседника будет время слушать голосовые сообщения?!
Я не понимаю - у Вас, значит, времени нет, а на время собеседника пофигу? Это как?

п.с. проблема не в том, что не времени, а в том что когти длинные и русский хромает - отсюда и популярность голосовых.

Ответить
0

У Вас странные аргументы!
Если Вам записывают 2-х минутное аудио и 1,5 минуты из них эээ-кают .. я Вам сочувствую! Я же записываю лаконичные и краткие аудио, в случаях, когда мне действительно неудобно.. и мои собеседники/сотрудники/партнеры не против)
Единственное, в чем я вижу недостаток- не всем удобно сразу прослушать аудио, в этом может помочь Денис со своим ботом!
По-моему, удобно)

Ответить
11

Понимаете, Инга, прочитать сообщение можно за пару секунд, уловить основной смысл. Понять, важно это, или просто прикол.

Голосовое же нужно прослушать от и до. И желательно в тихой располагающей обстановке.

Если, допустим, я еду за рулём, какая реакция будет на голосовое сообщение?
Или, что намного чаще, я просто занят. Втыкаю в комп и решаю задачу. Вдруг - уведомление "сервер лежит!". Сообщение важное, нужно всё бросить и помочь клиенту.
Напротив, голосовое сообщение на 7 секунд. Да я даже не прервусь из-за текущей задачи! Хрен его знает, что там - пожелание здоровья или проблема.

Поэтому я считаю голосовые сообщения неуважением к собеседнику. У вас-то удалось его записать, но удастся ли собеседнику его внимательно прослушать? Большой вопрос.

Голосовые я иногда слушаю. Но вечером, после работы. Вам удобно их записывать, а мне их удобно слушать вечером. Паритет.

Ответить
3

Плюс по голосу нет поиска, что иногда удобно в будущем

Ответить
1

В Ваших словах есть правда, и да, прослушивать не всегда удобно или приятно !
Но выбор каждого пользоваться данной услугой или нет. Я уверена, в Вашем случае, клиенты/ сотрудники/друзья знают о Вашем отношении к аудио, но это не значит, что оно НЕ подходит всем.

Ответить
2

Что значит - "пользоваться данной услугой или нет"?
Мне присылают голосовые - что мне делать, если я не могу тут же их прослушать?

Просто рекомендую никому не отправлять голосовые сообщения - попадётся такой же занятый человек - и будут проблемы.
Уважайте собеседника, и он ответит тем же.

Наверное, видите, какие я тут пишу тексты, длинные и понятные. Такие же я пишу в мессенджерах. Мне проще чётко написать собеседнику, что необходимо, выделить основную тему, а не использовать голосовые.

Честно напишу, что я никогда не использовал голосовые как исходящие. Я понимаю всецело, что человек может быть занят. Что ему "прямщас" не удобно ответить. Именно поэтому в качестве средства коммуникации я обожаю электронную почту, email - ты просто пишешь когда удобно, а тебе отвечают, когда им удобно.

p.s. мне набить длинный текст не западло. я уважаю русский язык, равно как и любой другой, могу набить такую же простыню на инглише и на дойче. каждый свой текст я набиваю так, чтобы меня понял собеседник.

Ответить
0

В машине как раз удобнее нажать один раз воспроизведение и слушать, чем читать, и раз человек потратил время на запись голосового сообщения, значит он вас все таки уважает, а прослушать это сообщение займет ровно то же время, что и его запись

Ответить
0

Я не знаю, как Вы читаете, может, по слогам, а я читаю по диагонали.
Когда видишь текст размером даже во весь экран, глаза быстро пробегаются, и находят ключевые фразы - на это нужны доли секунды!
А дальше либо приступаешь к решению проблемы, либо пропускаешь до более подходящего момента.

Это намного удобнее и быстрее, чем опусы ни о чём слушать несколько минут, пытаясь услышать, что там конкретно рассказали.
Потому, что при отправке голосовых человек не слышит собеседника, его никто не исправляет - и сообщение забивается посторонними звуками, и даже звуками того, кто отправляет. Сопение, пыхтение, кашель, выдох дыма сигареты - список можно продолжать.

Ответить
0

Уважаемый, по слогам дети читают, а отвлекаться от дороги находясь за рулем не советую даже на пару секунд. Боком вам выйдет однажды чтение "опусов ни о чём" даже по диагонали.

Ответить
0

Я никогда не отвлекаюсь от дороги, это плохая привычка. Для звонков есть BT, а чтобы взглянуть на уведомления, достаточно остановки перед светофором.

Если же там будут голосовые, а не текст, я много времени после старта потрачу. Да ещё напрягайся, разбирай, что там хотели сказать.

Текстовое же уведомление с проблемой - это повод остановиться на обочине.

Ответить
2

надо ии подключить, шоб одно сообщение на час сокращал до 5 секунд и выдавал всю суть без воды

Ответить
2

Голосовые сообщения это пиздос конкретный. Дегенератство лютое хоть вроде человк знакомый. Я хз, но меня бесит, а слушать это говно явно надо быть особенным.

Ответить
1

Сделайте чтобы оно автоматически показывало - не доставлено и не отправлялось повторно

Ответить
0

Интересный бот👍

Ответить
0

Спасибо, полезно! 

Ответить
0

А он может аудио файл с диктофона преобразовать?

Ответить
0

Нет, распознавание файлов не предусмотрено. Только небольшие голосовые сообщения.

Ответить
0

Этот комментарий сделан голосовым сообщением

Ответить

Комментарий удален

0

Все эти боты ещё очень плохо справляются со своей основной задачей, попробовал - не понравилось, много ошибок

Ответить
0

Так их смысл не в этом. А в том, что вы добровольно заливаете туда тонны своих и чужих разговоров. Это как тест "введите свой e-mail и телефон и на основе ваших ФИО мы подскажем, какая вы фея Винкс", только чуть более продвинутый уровень.

Ответить
0

Эх, если бы была возможность монетизировать все эти данные, то я бы уже был миллиардером :(

Ответить
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "Article Branding", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cfovx", "p2": "glug" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Баннер в ленте на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "disable": true, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } }, { "id": 20, "label": "Кнопка в сайдбаре", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cgxmr", "p2": "gnwc" } } } ] { "page_type": "default" }