{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Мне надоело получать голосовые от друзей по 5 минут в Telegram и WhatsApp и создал бот для краткого изложения

Активное развитие мессенджеров привело к разделению общества на сторонников и противников голосовых сообщений.

Проблема, с которой я столкнулся, - отсутствие времени на прослушивание длинных голосовых сообщений.

Вот основные аргументы против использования голосовых сообщений:
1. Невозможность быстрого просмотра и понимания ключевых моментов, как при чтении текста.
2. Неудобство прослушивания в шумных и переполненных местах.
3. Отсутствие возможности поиска и нахождения важной информации в голосовых сообщениях.

Решение: Pop Audio Bot

Я создал простого Telegram-бота, который преобразует голосовые и видео-сообщения в текст. Если сообщение длится более 25 секунд, бот отправляет краткое изложение в дополнение. Чтобы воспользоваться ботом, достаточно переслать сообщение из любого диалога в Telegram (или из WhatsApp). Бот поддерживает голосовые сообщения, аудио, видео и видео-кружочки, при условии, что размер файла не превышает 20 Мб.

Что касается безопасности ваших данных...

Ваши голосовые файлы не хранятся на нашем сервере. Они загружаются, преобразуются в соответствующий формат для передачи в OpenAI и немедленно удаляются. История взаимодействия с ботом также не сохраняется.

Зачем нужен этот бот, если есть Telegram Premium и другие аналогичные боты?

Действительно, уже существует немало ботов, предоставляющих подобные возможности. Однако многие из них ограничены по длительности файлов (обычно до 90 секунд) или поддерживают только голосовые сообщения. Я постарался объединить лучшее из них, чтобы обеспечить наибольшее удобство использования бота. В отличие от Telegram Premium, главным преимуществом моего бота является возможность получить краткое изложение текста, что позволит сэкономить время пользователям.

Как работает бот?

Бот полностью основан на API OpenAI. Для расшифровки аудио используется голосовая модель "whisper", способная обрабатывать 96 различных языков. Извлечение основной идеи из текста осуществляется моделью "gpt-3.5-turbo".

Бесплатно ли использовать бот?

Я решил с самого начала предоставить бесплатную версию с ограниченным функционалом, а также платную версию. Бесплатная версия позволяет преобразовывать до 3 сообщений в день, каждое продолжительностью до 60 секунд. Платная версия обеспечивает безлимитный доступ и позволяет обрабатывать сообщения длительностью до 10 минут.

Также я с большим интересом жду ваши отзывы и предложения по улучшению продукта. Не стесняйтесь делиться своим мнением ниже, включая и хейтеров.

0
13 комментариев
Написать комментарий...
Влад Каничев

Ну всё теперь. Новый айфон отменяется

Ответить
Развернуть ветку
Bobby Jazzz

Идея классная ,действительно не всегда удобно слушать голосовые сообщения ,а вопросы решать нужно на момент их получения

Ответить
Развернуть ветку
Alex Melnikoff

отправлять в ответ картинку с изображением голосового-проще и приятнее

Ответить
Развернуть ветку
fedafone

Классная идея!

Ответить
Развернуть ветку
Tony Sib

норм идея) похожее сделали на сервисе от сбера - салютспиче, можно как из текста в звук так и из речи в текст, удобненько)

Ответить
Развернуть ветку
НеЭксперт
Автор

Кстати, стоимость SaluteSpeech для расшифровки аудио для юр фирм сопоставима с подключением к OpenAi. Только второе на мой взгляд все же удобнее

Ответить
Развернуть ветку
unknown

Очень интересно услышать полную историю про пару и Белек

Ответить
Развернуть ветку
НеЭксперт
Автор

Хах, счастливый финал, все живы и здоровы

Ответить
Развернуть ветку
НеЭксперт
Автор

.

Ответить
Развернуть ветку
Ольга Ц

Соглашусь, не всегда удобно прослушивать сообщения. Так что, такой бот полезная вещь, похоже.

Ответить
Развернуть ветку
НеЭксперт
Автор

Спасибо за обратную связь!

Ответить
Развернуть ветку
Валерия Солодовникова

Попробовала закинуть сообщение, набор слов получился. Но видимо из за специфических терминов. Простые сообщения расшифровывает. Краткий пересказ не передает главную мысль голосовухи. Но идея 100% крутая.

Ответить
Развернуть ветку
НеЭксперт
Автор

Да, в терминах он правда может путаться, чем больше контекста в аудио, тем лучше он расшифрует. Насчет того, что не передал основную мысль - не замечал такого за все время, пока сам проводил тесты.

Ответить
Развернуть ветку
10 комментариев
Раскрывать всегда