Alexander Zelenukhin

+28
с 2023
1 подписчик
2 подписки

Если нужно gui - ставьте SubtitleEdit, подгружаете в него аудио или видео и выбираете речь в текст - Whisper.

1

Гуглим Purfview - whisper-standalone-win
Полностью бесплатно. На современной карте nvidia (cuda) работает довольно быстро. Версия xxl - ещё и с помощью другой нейросети голос от фона отделяет перед распознаванием. Рекомендую использовать модель large-v2.

3

Там есть кнопка. Откройте Manage Models, там значок открыть папку с моделями (для этого скачайте доступные модели). А потом просто подмените модели. Я советую использовать модели medium. Скачайте в программе доступные в бесплатном режиме модели Small (обычная и English Only) и подмените их моделями Medium, переименовав модели Medium в ggml-model-whisper-small.bin и ggml-model-whisper-small.en.bin соотвественно. Модели Medium гуглятся "huggingface ggerganov whisper.cpp".

1

Всех прав в Android TV нет, но конкретно права на доступ к микрофону в Android TV есть. Живут в Настройки - Приложения - Разрешения Приложений. Более того по умолчанию доступ к микрофону у всех приложений отключен - при первом вызове вылезает запрос на получение прав.

В новой версии библиотеки переехали сюда:
/Users/Имя пользователя/Library/Application Support/MacWhisper/models

1

Если вы используете Windows, то Whisper можно найти в прекрасном редакторе для субтитров - Subtitle Edit, в меню Видео.

11

Скачиваем MacWhisper. Нажимаем в Finder показать содержимое, в папке Resources 2 файла: ggml-model-whisper-base.bin и ggml-model-whisper-tiny.bin. base - это базовая модель, tiny - режим fast. Заменяем любую из них на модель ggml-large.bin, загуглив "huggingface ggerganov whisper.cpp", обязательно переименовав её в ggml-model-whisper-base.bin или ggml-model-whisper-tiny.bin. Запускаем MacWhisper. Если заменили модель tiny не забудьте переключиться на режим fast.

11