Зачем платить $XX в месяц за Superwhisper и альтернативы, если можно сделать бесплатно за 5 минут?
Когда хотят денег за то, что работает локально
Знакомо? Нужна диктовка на Mac — и сразу появляются решения с подпиской: SuperWhisper, другие сервисы. Месячная подписка, годовая подписка. А еще они отправляют ваш голос в облако, требуют интернет и собирают данные.
А что если я скажу, что можно сделать то же самое бесплатно, локально, без интернета и с сопоставимой точностью? Поехали.
История одной проблемы
Работаю над проектом, нужно быстро записывать мысли. Пробую платные решения:
- SuperWhisper — удобно, но ежемесячная подписка за то, что работает у меня на Mac
- Облачные API — нужен интернет, данные уходят на сервер
- Встроенный диктатор macOS — точность так себе
И тут мысль: а что если Whisper Large v3, который все используют, работает локально? И почему я должен платить за обертку вокруг open-source решения?
Приятная новость для всех, кто платит за диктовку
Если вы пользуетесь платными подписками на подобные сервисы — у меня для вас приятная, замечательная, удивительная новость. Все это можно делать бесплатно. Да, вы правильно прочитали — абсолютно бесплатно, без подписок, без ограничений.
Можете пользоваться прямо сейчас.
Что получилось: VTTv2
✅ Полностью бесплатно — никаких подписок, никаких ограничений -
✅ 100% локально — все данные остаются на вашем Mac -
✅ Работает офлайн — интернет не нужен после установки -
✅ Модель Large v3 — максимальная точность -
✅ Автовставка текста — как в платных решениях -
✅ Оптимизация для Apple Silicon — быстрее чем облачные API
Как это работает
1. Установка: Клонируете репозиторий, компилируете whisper.cpp, скачиваете модель (один раз, потом работает офлайн)
2. Использование: Нажимаете Option+Space, говорите, нажимаете еще раз — текст появляется в месте курсора
3. Всё. Никаких подписок, облаков и ограничений.
Практические кейсы
Кейс 1:
Быстрые заметки Раньше: Открываю Notes, включаю диктатор macOS, жду, правлю ошибки. Теперь: Option+Space, говорю, Option+Space — текст уже в Notes. За 5 секунд вместо минуты.
Кейс 2:
Работа над документами Раньше: Переключаюсь между клавиатурой и мышью, печатаю медленно. Теперь: Диктую мысли прямо в документ, не отрываясь от экрана. Скорость увеличилась в разы.
Кейс 3:
Безопасность данных Раньше: Голос уходит в облако, не знаю где хранится. Теперь: Все на моем Mac, никаких данных не покидает компьютер. Для конфиденциальных проектов — идеально.
Почему это важно
1. Приватность. Ваш голос не отправляется никуда. Для бизнеса, юристов, врачей — критично.
2. Экономия. Никаких подписок. За сэкономленные деньги можно купить хороший микрофон или улучшить Mac.
3. Свобода. Нет зависимости от подписок. Работает когда нужно, сколько нужно.
4. Контроль. Можете настроить под себя, изменить код, добавить функции.
Технические детали (для тех, кто понимает)
- whisper.cpp — C++ реализация Whisper от ggerganov, оптимизированная для различных платформ
- Core ML + Metal — ускорение на Apple Silicon (M1/M2/M3/M4)
- Python 3.12 — основной язык, легко расширять
- rumps — нативное меню в строке меню macOS
- PyObjC — интеграция с macOS API для автовставки текста
Модель Large v3 обеспечивает точность сравнимую с коммерческими решениями, но работает локально и бесплатно.
Установка за 5 минут
1. Клонируем репозиторий
git clone git@github.com:FUYOH666/VoiceToText-MACos.git cd VoiceToText-MACos
2. Компилируем whisper.cpp git clone
https://github.com/ggerganov/whisper.cpp.git cd whisper.cpp && mkdir build && cd build cmake .. -DBUILD_SHARED_LIBS=ON && make -j8 cd ../..
3. Скачиваем модель (один раз, потом работает офлайн)
mkdir -p models cd models curl -L "https://huggingface.co/ggerganov/whisper.cpp/resolve/main/ggml-large-v3.bin" -o ggml-large-v3.bin cd ..
4. Устанавливаем зависимости
python3.12 -m venv venv source venv/bin/activate pip install -r requirements.txt
5. Запускаем python src/main.py
Настройка разрешений macOS (микрофон и Accessibility) — и готово. Работает сразу.
Что дальше?
Проект открыт на GitHub: https://github.com/FUYOH666/VoiceToText-MACos
Можете:
- Использовать как есть
- Настроить под себя
- Добавить функции
- Сделать форк и улучшить
Никаких ограничений. Это open-source проект, который показывает: то, за что платят деньги, можно сделать бесплатно и лучше.
Вывод
Платные решения удобны, но зачем платить за то, что работает локально и бесплатно? VTTv2 — доказательство того, что open-source может быть лучше коммерческих решений.
Попробуйте сами. Если поможет — поставьте звезду на GitHub. Если есть идеи — создайте issue или pull request.
---
P.S. Для тех, кто говорит "но это же сложно установить" — смотрите инструкцию выше. Если умеете работать в терминале, это займет 5 минут. А экономия от отмены подписки — стоит того.
P.P.S. Если кто-то говорит, что это "не так удобно" — попробуйте. После установки использование такое же: Option+Space, говорите, Option+Space. Но бесплатно и локально.
---
Сделано для сообщества macOS разработчиков. Если проект помог — поделитесь с друзьями или коллегами. Контакты для связи: Telegram