7 сервисов транскрибации: сравниваю по скорости, цене и количеству ошибок

Когда мне говорят прийти куда-то где есть дресс код я всегда против, но когда сегодня мне все, вплоть до Андрюхи Аполлонова и организаторов, триста раз попросили чтобы я пришла в белом, я не могла не ослушаться и пришла в белом… Сравниваю лучшие российские транскрибаторы аудио и видеофайлов в текст. В конце статьи — крутая таблица для наглядности.

7 сервисов транскрибации: сравниваю по скорости, цене и количеству ошибок

Привет, это Роман Рабочий — разработчик Писца, Маши-секретаря и сервиса Планёрка. Мне стало интересно сравнить нашего Писца-расшифровщика с другими сервисами автоматической транскрибации, которые распознают русский язык и принимают оплату с российских банковских карт. Рассказываю, что получилось.

Чтобы было не скучно читать, я взял старый добрый шедевр Реутов ТВ с Бузовой. Вот это видео:

Я не могла НЕ ослушаться 😂

По каким критериям буду сравнивать:

Частота ошибок в словах. На языке маркетинга это называется Word Error Rate или сокращенно — WER. Процент ошибок в распознавании слов от общего числа слов.

В общем, берем сто слов и считаем, сколько в них ошибок — это и есть процент WER.

Стоимость расшифровки — в минутах, часах или пакетах, неважно. О каждом сервисе пишу, сколько можно расшифровать бесплатно и сколько стоит то, что платно.

Скорость обработки. Специально выбрал видео чуть меньше минуты, чтобы было видно на небольшом формате — кто быстрее.

Знаки препинания — есть ли они вообще и насколько они адекватны.

Абзацы — есть или нет.

Разбивка текста на спикеров — крайне важная функция если на записи беседуют несколько человек, например, созвон в зуме или конференция.

Ну штош, погнали 🚀

1. Teamlogs

При входе на сайт сервис предлагает зарегистрироваться и дарит 15 бесплатных минут транскрибации. Можно войти через Гугл или Яндекс, чтобы не возиться с паролем и подтверждением. Перетаскиваем файл в окошко загрузки и ждем — текст откроется прямо в интерфейсе.

7 сервисов транскрибации: сравниваю по скорости, цене и количеству ошибок

Что имеем:

  • Частота ошибок в словах: 18%.
  • Стоимость: бесплатно 15 минут. Потом зависит от количества минут: файл до получаса обойдется 20 ₽/мин, до часа 10 ₽/мин и так далее. Самая дешевая тарификация — 6 ₽/мин будет доступна если купите пакет размером в 5001 минуту за 30 тыс ₽.
  • Скорость: наш видос обработал за 2,5 минуты.
  • Знаки препинания: есть, но не все корректные.
  • Абзацы: есть.
  • Разбивка на спикеров: есть.

Вывод: есть разбивка на спикеров и абзацы — это хорошо. Ошибок в тексте довольно много, теряет часть реплик, пишет фамилии со строчной буквы, а вот «Белого» почему-то решил писать с заглавной. Если нужно расшифровать часовой файл — заплатите 600 ₽. Ну или покупайте пакеты за десятки тысяч рублей и тогда будет чуть дешевле.

Краткое содержание перед текстом получилось невпопад: «Спикер 0 не хочет идти в Белый, потому что ему постоянно звонит Андрей Аполлонов» 😛

2. Speechtotext

Сервис встречает приглашением пройти регистрацию. Тапнуть в логотип Гугла или ВК не получится — придётся дважды вводить пароль и подтверждать аккаунт через почту. Теперь загружаем файл, ждем и читаем результат прямо на сайте. Ну или скачиваем в формате doc.

Ошибок меньше, чем у предыдущего коллеги, но читать тяжеловато
Ошибок меньше, чем у предыдущего коллеги, но читать тяжеловато

Что имеем:

  • Частота ошибок в словах: 9%
  • Стоимость: бесплатно 10 минут, потом 100 ₽ в час.
  • Скорость: около 10 секунд.
  • Знаки препинания: есть, но много некорректных.
  • Абзацы: ну один поставил, рандомный.
  • Разбивка на спикеров: нет.

Вывод: ошибок в тексте немного, но они напряжные. Принципиально неправильные слова: «официант Андрюшка Аполлонов». Начало и окончание предложения определены неверно и искажают смысл: «…да, когда он 300. Раз меня все предупредили…» Представьте, если в часовом созвоне будет таких ошибок штук 30? Будет очень сложно что-то понять.

3. Conspecto

На главной странице написано, что сервис конвертирует в текст «с помощью самой совершенной на сегодняшний день модели искусственного интеллекта». Различает 50 языков, поддерживает много форматов и не требует регистрации. Еще у сервиса есть телеграм-бот, но нам его тестить лень и мы сделаем все в браузере.

<p>Текст можно прочитать на сайте и скачать в TXT, HTML или DOC</p>

Текст можно прочитать на сайте и скачать в TXT, HTML или DOC

Что имеем:

  • Частота ошибок в словах:1%
  • Стоимость: бесплатно одна минута, потом 3 ₽/мин за транскрибацию или 4 ₽/мин за нее же, но с конспектом.
  • Скорость: 20 секунд.
  • Знаки препинания: есть, вполне ок.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: текст чистенький, почти без ошибок. Хорошо, что есть тг-бот. Маловастенько дают бесплатно, всего одну минутку, но хозяин — барин. Плохо, что текст сплошняком. Фирменная фишка сервиса — конспект, с ним транскрибация стоит на руб дороже (буквально). Я заказал расшифровку с конспектом, смотрите что получилось:

7 сервисов транскрибации: сравниваю по скорости, цене и количеству ошибок

Ну как-бы ок 🤷‍♂

4. Any2text.ru

На главной странице нас встречает окошко, в которое нужно перетащить файл для транскрибации. Сервис поддерживает много языков и предлагает скачать расшифровку в нескольких форматах на выбор — docx, xlsx, srt или txt. Регистрироваться не нужно, просто загружаете файл, ждете и смотрите результат.

<p>Прикольная фича — если нужна расшифровка с ютуба, можно просто вставить ссылку</p>

Прикольная фича — если нужна расшифровка с ютуба, можно просто вставить ссылку

Что имеем:

  • Частота ошибок в словах: ошибок нет, маладэц.
  • Стоимость: бесплатно 15 минут. Потом 5 ₽/мин транскрибации если не регистрируешься. Если зарегистрироваться и пополнить баланс на тыщу рублей — 4 ₽/мин.
  • Скорость: наше видео обработал за одну минуту.
  • Знаки препинания: есть, корректные.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: шустрый, чистый сервис, переводит без ошибок. Часовой видос обойдется в 300 рублей или в 240 со скидкой после регистрации. На абзацы и спикеров не делит: если у вас многочасовой созвон в зуме на пять человек, замучаетесь потом вручную разбивать и разбирать, кто где говорит.

5. WordWoice

При входе сервис предлагает зарегистрироваться по почте или через ВК. После регистрации в личном кошельке оказывается 90 рублей, которые можно потратить на тестовую расшифровку. Под окошком загрузки — чек-бокс для иностранного текста, если его отметить, предлагает сделать перевод.

<p>Результат можно прочитать на сайте и скачать файлом. А ещё можно послушать или скачать аудиофайл</p>

Результат можно прочитать на сайте и скачать файлом. А ещё можно послушать или скачать аудиофайл

Что имеем:

  • Частота ошибок в словах: 2%.
  • Стоимость: 5 руб/мин, при регистрации дарят 90 ₽.
  • Скорость: 40 секунд.
  • Знаки препинания: есть.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: хороший, чистенький перевод и стильный интерфейс. Разбивает текст на таймкоды, ставит их даже посреди предложения. Удобно, что можно тыкнуть в тайм-код и прослушать этот момент в аудиозаписи. В скачанном файле транскрибации таймкодов нет — просто текст сплошняком. Расшифровка часового созвона обойдется в 300 ₽.

6. Apihost

Apihost — солидный набор сервисов по работе с аудио и текстами. Он умеет в озвучку, изменение голоса и еще кучу всего. В том числе есть и транскрибатор. Чтобы загрузить файл, нужно зарегистрироваться. После регистрации в личном кабинете было написано, что у меня баланс ноль рублей — про бесплатные минуты я нигде ничего не нашел. Но я рискнул загрузить наш видос. И…

<p>Такой приличный сервис — и матом матерится 😂</p>

Такой приличный сервис — и матом матерится 😂

Что имеем:

  • Частота ошибок в словах: 18%
  • Стоимость: 2,4 руб/мин
  • Скорость: 25 секунд.
  • Знаки препинания: есть, какие попало.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: ну, такое. Что матом ругается — полбеды. Что имена пишет со строчной — тоже простим.. Но транскрибатор неправильно определяет начало и конец предложения, сливает очевидно разные предложения в одно — длинное и бессмысленное. Получается эталонное нечитаемоеполотнотекста. За час текста — 144 ₽, пополнять можно минимум на 500 ₽. Максимальный размер файлов для загрузки — 200 мб, маловато.

7. Писец

И на сладенькое — наш Писец. Я не буду расхваливать нашего ИТ-пушистика и честно сравню его с другими конкурентами. Регистрироваться на сервисе не надо, заходим на сайт, грузим файл, указываем почту и выбираем количество спикеров — от одного до пяти. После этого можно закрыть браузер и идти пить кофе, текст придёт на почту.

<p>Писец называет спикеров персонажами книги Алана Милна — просто для настроения;)</p>

Писец называет спикеров персонажами книги Алана Милна — просто для настроения;)

Что имеем:

  • Частота ошибок в словах: 2%
  • Стоимость: бесплатно один час в месяц на высокой скорости. Потом тоже бесплатно, но медленнее.
  • Скорость: 40 секунд.
  • Знаки препинания: есть.
  • Абзацы: есть.
  • Разбивка на спикеров: есть.

Вывод: Писец недослышал одно слово в первой реплике и один раз пропустил слово «какой». При этом он крайне хорош в том, чтобы определять реплики спикеров и назначать им таймкоды.

Мы предлагаем всем пользователям один час расшифровки в месяц бесплатно на высокой скорости. А потом — тоже бесплатно, но медленнее.

А если хотите быстрее — можно купить пакет минут по очень демократичной стоимости:

990 ₽ за 10 часов (1.65 ₽/мин)

1620 ₽ за 20 часов (1,35 ₽/мин)

1980 ₽ за 30 часов (1,1 ₽/мин) с постобработкой в ChatGPT.

Пакеты минут не ограничены во времени использования — можете за месяц потратить или на несколько лет растянуть.

Так, ну и теперь сравнительная табличка

7 сервисов транскрибации: сравниваю по скорости, цене и количеству ошибок

Приглашаю вас попробовать нашего Писца в деле!

Загружайте созвон, конференцию, видеолекцию — всё что вашей душе угодно! Писец всё расшифрует, поставит запятые и абзацы, разобьет текст на спикеров, чтобы сэкономить ваше время и нервы.

1919
18 комментариев

Там whisper3 вышел, кому теперь вообще эти платные сервисы по распознаванию сдались?

4
Ответить

А он умеет на спикеров делить? 🤔

Ответить

Ром, это же самый пост тут уже был несколько дней назад от аккаунта под названием Писец. То есть от тебя же.

В чем суть повтора публикации? Или у людей память золотых рыбок?

Или ты хочешь донабрать клиентуру?

1
Ответить

Мне было интересно сравнить как влияет количество подписчиков автора на успех статьи.
Пока что вывод такой, НИКАК )
Больше я так делать конечно же не буду.

2
Ответить

Очень смешной видос выбрали для расшифровки))

1
Ответить

это были прекрасные времена

2
Ответить

кликбейт какой-то...

1
Ответить