Команда соцсети разработала нейросеть, которая может расшифровывать аудиозаписи длительностью до 30 секунд.
А нельзя в момент отправки это сделать? Надиктовал , сеть обработала и вывела текст. Если все в норме отправили.
Типа вот так?
на самом деле голосовухи передают потому что это быстро и эмоционально, а не просто потому что лень, хотя может я это придумал как отмазу для тех кто их отправляет