Я вспомнил, что когда-то Яндекс Speech Kit помог мне с подобной задачей и решил попробовать. Правила работы сервиса сильно изменились с тех пор, пришлось изобретать велосипеды, изучать как работают аудио кодеки и сервера на Linux. В ручном режиме, отправляя запросы через Postman, за вечер я смог получить расшифровку обеих записей и мы реально афигели от ее результатов. Расшифровались даже моменты где люди перебивали друг друга или говорили на заднем плане. Пожалуй это единственное, где иногда приходилось переслушивать запись. Если человек говорил один, то все было интуитивно понятно. И это запись с диктофона на iPhone Карл!
Крутой сервис! Когда работал на радио так же приходилось переводить голос. Хвала небесам, что интервью у меня были короткими, но вот коллега получала часовые записи. Вот она стрелялась...
Спасибо!)
Да это отлично сервис с этом сервис можно работать очень легко