Гуглим Purfview - whisper-standalone-win Полностью бесплатно. На современной карте nvidia (cuda) работает довольно быстро. Версия xxl - ещё и с помощью другой нейросети голос от фона отделяет перед распознаванием. Рекомендую использовать модель large-v2.
Гуглим Purfview - whisper-standalone-win
Полностью бесплатно. На современной карте nvidia (cuda) работает довольно быстро. Версия xxl - ещё и с помощью другой нейросети голос от фона отделяет перед распознаванием. Рекомендую использовать модель large-v2.
Если нужно gui - ставьте SubtitleEdit, подгружаете в него аудио или видео и выбираете речь в текст - Whisper.
У меня один вопрос, если ты такой умный то почему бедный? )))))
Идея на поверхности, получается нужно всего лишь карту nvidia и хоп хоп и в дамки