Telegram-бот на основе ИИ Voix переводит аудио в текст и может выполнять расшифровку голосовых сообщений до 15 минут. Благодаря мощной нейросети конвертация аудио и видео в текст происходит моментально.
Не хватает разбивки по голосам в диалогах. Когда реплики разных людей сливаются в единый текст, становится трудно читать.
Ценное замечание! Можно попробовать осуществить такую разбивку...