Как переводить аудио и видео в тексты бесплатно

Новый бесплатный сервис транскрибации, который мы сделали для своей редакции, но решили поделиться со всеми копирайтерами, SMM, маркетологами, эйчарами… В общем, со всеми, кому приходится работать с записями.

Перевод из аудио и видео в текст бесплатно

Всем привет! Пару лет назад я собрал редакцию для заполнения сайта и маркетинга своей IT-компании MediaTen. Ребята показали себя сильными специалистами, и я решил открыть под них новое направление SOLOMA agency, которое теперь занимается контентом для бизнеса.

Мы довольно быстро получили первых клиентов и большой поток задач, для ускоренного решения которых подобрали райтерские инструменты. Одним из них стал Speech2Text — транскрибатор аудио и видео в текст.

Но кто им пользовался, тот знает, что это платный сервис транскрибации с лимитами. И заводить его под каждого участника команды при крупных объемах — не очень выгодно. А у нас, помимо постоянных интервью со спикерами, еще есть записи брифов с клиентами и собеседований эйчара с соискателями.

Мы поступили как разработчики — собрали свой транскрибатор Soloma Speech. Пару месяцев им пользовались только наши райтеры и HR. Но мы поняли, что нехорошо это — не делиться с коллегами.

Что умеет наш транскрибатор

Как переводить аудио и видео в тексты бесплатно

Сейчас Soloma Speech находится на уровне MVP и выполняет свою основную задачу — перевод из аудио и видео в текст.

Поддерживаемые форматы: MP3, M4A, OGG, AAC, WAV, FLAC, WMA, MP4, MKV, FLV, AVI, MOV, WMV, WEBM.

Ограничение по весу — до 500 МБ, по количеству файлов – до 5 штук одновременно.

Лимитов по минутам пока что нет. Регистрироваться не нужно.

Результаты мы нигде не храним, готовые материалы отправляются в чате с TG-ботом в двух форматах: json и txt.

Файлы лучше загружать с именами на латинице, без пробелов и пунктуационных знаков. В остальном — все привычно и просто.

В будущем хотим добавить саммари, другие форматы и AI, чтобы прям сразу собирать статьи.

Как работать с транскрибатором

Найти сервис транскрибации можно на сайте редакции — speech.soloma.agency или в Telegram — @SolomaSpeech_Bot.

  1. Для работы с сервисом вам понадобится никнейм или ID из TG. Скопируйте его, вставьте в поле и нажмите «Сделано».
  2. Загрузите файл. Система сама определяет, сколько человек говорит в записи, но вы можете самостоятельно указать количество спикеров.
  3. Обработка началась! Если у вас есть еще файлы, то загрузите их, если нет, то ждать необязательно. Когда текст будет готов, его пришлет бот в TG.
Сервис транскрибации: начало работы
Сервис транскрибации: начало работы
Сервис транскрибации: загрузка файла
Сервис транскрибации: загрузка файла
Сервис транскрибации: выбор количества спикеров
Сервис транскрибации: выбор количества спикеров
Сервис транскрибации: обработка файла
Сервис транскрибации: обработка файла
Сервис транскрибации: завершение обработки файла
Сервис транскрибации: завершение обработки файла
Сервис транскрибации: результат в TG
Сервис транскрибации: результат в TG

Вот и все) Буду рад, если наш сервис транскрибации окажется вам полезен. Еще больше — если дадите обратную связь в комментариях, какие сервисы используете в работе: платные утилиты, бесплатные аналоги.

Сейчас у нас запущен целый ряд инструментов, которые пригодятся в работе и в бизнесе. Узнать о них и наших подходах можно в TG-канале — MediaTen: Нас Reboot, а мы крепчаем.

3
Начать дискуссию