Офлайн распознавание речи. Библиотека Vosk

Недавно нам была поставлена задача конвертировать аудиозаписи в текст для дальнейшего анализа. Обязательные условия: офлайн обработка, невысокая требовательность к системным ресурсам, и возможность автоматизации процесса. Мы выбрали Python и библиотеку vosk-api.

12

Добрый день! Подскажите пожалуйста что записать в коде чтоб программа запрашивала путь к файлу( пример - ‪E:\Python\1.wav) и после его преобразовывала. Пробовал - wf = wave.open(input("Путь к файлу:")), не получается. выдаёт ошибку:
Traceback (most recent call last):
File "E:\Python\Proba\main.py", line 11, in
wf = wave.open(input("Путь к файлу:"))
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\79110\AppData\Local\Programs\Python\Python311\Lib\wave.py", line 630, in open
return Wave_read(f)
^^^^^^^^^^^^
File "C:\Users\79110\AppData\Local\Programs\Python\Python311\Lib\wave.py", line 280, in __init__
f = builtins.open(f, 'rb')
^^^^^^^^^^^^^^^^^^^^^^
OSError: [Errno 22] Invalid argument: '\u202aE:\\Python\\1.wav'

Ответить
Автор

Добрый день! Уточним информацию, вернемся с ответом )

Ответить
Автор

«u202a» - символ юникода обозначающий вставку слева-направо. Считайте строку, а потом извлеките этот символ из строки методом strip.

Решение вашей проблемы описано здесь: https://stackoverflow.com/questions/49267999/remove-u202a-from-python-string

Либо используйте необработанные строки.

Подробнее о необработанных строках тут: https://pythonim.ru/string/neobrabotannaya-stroka-v-python

Ответить