Telegram-бот на основе ИИ Voix переводит аудио и видео в текст и может выполнять расшифровку голосовых сообщений до 15 минут, а также загружать аудио и видео до 3 часов и направлять в ответ текстовый файл. Благодаря мощной нейросети конвертация голоса в текст происходит моментально.
Не хватает разбивки по голосам в диалогах. Когда реплики разных людей сливаются в единый текст, становится трудно читать.
Ценное замечание! Можно попробовать осуществить такую разбивку...