Как переводить аудио и видео в тексты бесплатно
Новый бесплатный сервис транскрибации, который мы сделали для своей редакции, но решили поделиться со всеми копирайтерами, SMM, маркетологами, эйчарами… В общем, со всеми, кому приходится работать с записями.
Всем привет! Пару лет назад я собрал редакцию для заполнения сайта и маркетинга своей IT-компании MediaTen. Ребята показали себя сильными специалистами, и я решил открыть под них новое направление SOLOMA agency, которое теперь занимается контентом для бизнеса.
Мы довольно быстро получили первых клиентов и большой поток задач, для ускоренного решения которых подобрали райтерские инструменты. Одним из них стал Speech2Text — транскрибатор аудио и видео в текст.
Но кто им пользовался, тот знает, что это платный сервис транскрибации с лимитами. И заводить его под каждого участника команды при крупных объемах — не очень выгодно. А у нас, помимо постоянных интервью со спикерами, еще есть записи брифов с клиентами и собеседований эйчара с соискателями.
Мы поступили как разработчики — собрали свой транскрибатор Soloma Speech. Пару месяцев им пользовались только наши райтеры и HR. Но мы поняли, что нехорошо это — не делиться с коллегами.
Что умеет наш транскрибатор
Сейчас Soloma Speech находится на уровне MVP и выполняет свою основную задачу — перевод из аудио и видео в текст.
Поддерживаемые форматы: MP3, M4A, OGG, AAC, WAV, FLAC, WMA, MP4, MKV, FLV, AVI, MOV, WMV, WEBM.
Ограничение по весу — до 500 МБ, по количеству файлов – до 5 штук одновременно.
Лимитов по минутам пока что нет. Регистрироваться не нужно.
Результаты мы нигде не храним, готовые материалы отправляются в чате с TG-ботом в двух форматах: json и txt.
Файлы лучше загружать с именами на латинице, без пробелов и пунктуационных знаков. В остальном — все привычно и просто.
В будущем хотим добавить саммари, другие форматы и AI, чтобы прям сразу собирать статьи.
Как работать с транскрибатором
Найти сервис транскрибации можно на сайте редакции — speech.soloma.agency или в Telegram — @SolomaSpeech_Bot.
- Для работы с сервисом вам понадобится никнейм или ID из TG. Скопируйте его, вставьте в поле и нажмите «Сделано».
- Загрузите файл. Система сама определяет, сколько человек говорит в записи, но вы можете самостоятельно указать количество спикеров.
- Обработка началась! Если у вас есть еще файлы, то загрузите их, если нет, то ждать необязательно. Когда текст будет готов, его пришлет бот в TG.
Вот и все) Буду рад, если наш сервис транскрибации окажется вам полезен. Еще больше — если дадите обратную связь в комментариях, какие сервисы используете в работе: платные утилиты, бесплатные аналоги.
Сейчас у нас запущен целый ряд инструментов, которые пригодятся в работе и в бизнесе. Узнать о них и наших подходах можно в TG-канале — MediaTen: Нас Reboot, а мы крепчаем.