ТОП-7 онлайн-сервисов транскрибации: сравниваю по скорости, стоимости и количеству ошибок в тексте

Взял кринжовый видос про озорные поры на носу Бузовой и посмотрел, как с ним справятся лучшие российские транскрибаторы аудио и видео файлов в текст. Сравнил полученный результат по целому списку критериев и составил крутую таблицу. Го смотреть 🚀🚀🚀

ТОП-7 онлайн-сервисов транскрибации: сравниваю по скорости, стоимости и количеству ошибок в тексте

Привет, это Писец — транскрибатор, искусственный интеллект и великий освободитель времени. Моё призвание — избавлять людей от мук рукопашной расшифровки. Я всё делаю красиво: делю текст на абзацы и спикеров, расставляю знаки препинания и тайминг.

Всем пользователям дарю час бесплатной расшифровки в месяц на высокой скорости. Хорошо понимаю все эти ваши «ропы», «митапы» и «лпр». И вообще — я клёвый и у меня лапки 🙌

В статье сравниваю между собой сервисы автоматической транскрибации, которые распознают русский язык и принимают оплату с российских банковских карт.

Мои коллеги-транскрибаторы какие-то серьезные все, я решил их кринжатинкой угостить 😝 Предложил им расшифровать видео, где Бузова выпендривается перед журналистом Мезенцевым, а он рассматривает озорные поры у нее на носу 🤣 Ну и сам я расшифровал этот видос тоже, разумеется.

По каким критериям буду сравнивать:

Частота ошибок в словах. На языке маркетинга это называется Word Error Rate или сокращенно — WER. Процент ошибок в распознавании слов от общего числа слов.

Кароч, берем сто слов и считаем, сколько в них ошибок — это и есть процент WER.

Стоимость расшифровки. Кто-то берет оплату за минуты, кто-то за часы, а кто-то и бесплатно расшифровывает — я, например. О каждом сервисе напишу, что именно бесплатно и что платно.

Скорость обработки. Специально выбрал видео чуть меньше минуты, чтобы было видно на небольшом формате — кто тупит, а кто нет.

Знаки препинания — есть ли они вообще и насколько они ок.

Абзацы — есть или нет.

Разбивка текста на спикеров — крайне важная функция если на записи беседуют несколько человек, например, созвон в зуме или конференция.

Ну штош, погнали 🚀

1. Teamlogs

При входе на сайт сервис предлагает зарегистрироваться и дарит 15 бесплатных минут транскрибации. Можно войти через Гугл или Яндекс, чтобы не возиться с паролем и подтверждением. Перетаскиваем файл в окошко загрузки и ждем — текст откроется прямо в интерфейсе.

<p>Перед текстом выдает краткое содержание, предлагает переименовать спикеров и выделяет ключевые слова. Расшифровку можно скачать в форматах docs, xlsx и srt</p>

Перед текстом выдает краткое содержание, предлагает переименовать спикеров и выделяет ключевые слова. Расшифровку можно скачать в форматах docs, xlsx и srt

Что имеем:

  • Частота ошибок в словах: 18%.
  • Стоимость: бесплатно 15 минут. Потом зависит от количества минут: файл до получаса обойдется 20 руб/мин, до часа 10 руб/мин и так далее. Самая дешевая тарификация — 6 руб/мин будет доступна если купите пакет размером в 5001 минуту за 30 тыщ рублей.
  • Скорость: наш видос обработал за 2,5 минуты.
  • Знаки препинания: есть, но не все корректные.
  • Абзацы: есть.
  • Разбивка на спикеров: есть.

Вывод: есть разбивка на спикеров и абзацы — молодец, выдаем леденец 🍭 Ошибок в тексте довольно много, теряет часть реплик, пишет фамилии со строчной буквы, а вот «Белого» почему-то решил писать с заглавной. Если нужно расшифровать часовой видос — заплатите 600 ₽. Ну или покупайте пакеты за десятки тысяч рублей и тогда будет чуть дешевле.

Дороговато, сорян. Краткое содержание перед текстом — вообще песня: «Спикер 0 не хочет идти в Белый, потому что ему постоянно звонит Андрей Аполлонов» 😛

2. Speechtotext

Сервис встречает приглашением пройти регистрацию. Тапнуть в логотип Гугла или ВК не получится, только олдскул: вводим пароль два раза, идем на почту и подтверждаем аккаунт. Теперь загружаем файл и читаем результат прямо на сайте. Ну или скачиваем в формате doc.

Ошибок меньше, чем у предыдущего коллеги, но читать тяжеловато
Ошибок меньше, чем у предыдущего коллеги, но читать тяжеловато

Что имеем:

  • Частота ошибок в словах: 9%
  • Стоимость: бесплатно 10 минут, потом 100 рублей в час.
  • Скорость: около 10 секунд.
  • Знаки препинания: есть, но много некорректных.
  • Абзацы: ну один поставил, рандомный.
  • Разбивка на спикеров: нет.

Вывод: ошибок в тексте немного, но они напряжные. Принципиально неправильные слова: «официант Андрюшка Аполлонов». Начало и окончание предложения определены неверно и искажают смысл: «…да, когда он 300. Раз меня все предупредили…» Представьте, если в часовом созвоне будет таких ошибок штук 30? Сорян, канеш, но получится непонятная шляпа.

3. Conspecto

На главной странице написано, что сервис конвертирует в текст «с помощью самой совершенной на сегодняшний день модели искусственного интеллекта». Допустим 😏 Различает 50 языков, поддерживает много форматов и не требует регистрации. Еще у сервиса есть телеграм-бот, но нам его тестить лень и мы сделаем все в браузере.

<p>Текст можно прочитать на сайте и скачать в TXT, HTML или DOC</p>

Текст можно прочитать на сайте и скачать в TXT, HTML или DOC

Что имеем:

  • Частота ошибок в словах:1%
  • Стоимость: бесплатно одна минута, потом 3 руб/мин за транскрибацию или 4 руб/мин за нее же, но с конспектом.
  • Скорость: 20 секунд.
  • Знаки препинания: есть, вполне ок.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: текст чистенький, почти без ошибок. Хорошо, что есть тг-бот. Маловастенько дают бесплатно, всего одну минутку, но хозяин — барин, как грицца. Плохо, что текст сплошняком. Фирменная фишка сервиса — конспект, с ним транскрибация стоит на руб дороже (буквально). Я заказал расшифровку с конспектом, смотрите что получилось:

<p>Ну как-бы ок 🤷‍♂</p>

Ну как-бы ок 🤷‍♂

4. Any2text.ru

На главной странице нас встречает окошко, в которое нужно перетащить файл для транскрибации. Сервис поддерживает много языков и предлагает скачать расшифровку в нескольких форматах на выбор — docx, xlsx, srt или txt. Регистрироваться не нужно, просто загружаете файл, ждете и смотрите результат.

<p>Прикольная фича — если нужна расшифровка с ютуба, можно просто вставить ссылку</p>

Прикольная фича — если нужна расшифровка с ютуба, можно просто вставить ссылку

Что имеем:

  • Частота ошибок в словах: ошибок нет, маладэц.
  • Стоимость: бесплатно 15 минут. Потом 5 руб/мин транскрибации если не регистрируешься. Если зарегистрироваться и пополнить баланс на тыщу рублей — 4 руб/мин.
  • Скорость: наше видео обработал за одну минуту.
  • Знаки препинания: есть, корректные.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: шустрый, чистый сервис, переводит без ошибок. Часовой видос обойдется в 300 рублей или в 240 со скидкой после регистрации. На абзацы и спикеров не делит: если у вас многочасовая конфа или созвон в зуме на пять человек, задолбаетесь потом вручную разбивать и въезжать, кто где говорит.

5. WordWoice

При входе сервис предлагает зарегаться по почте или через ВК. После регистрации в личном кошельке оказывается 90 рублей, которые можно потратить на тестовую расшифровку. Под окошком загрузки — чек-бокс для иностранного текста, если его отметить, предлагает сделать перевод.

<p>Результат можно прочитать на сайте и скачать файлом. А ещё можно послушать или скачать аудиофайл</p>

Результат можно прочитать на сайте и скачать файлом. А ещё можно послушать или скачать аудиофайл

Что имеем:

  • Частота ошибок в словах: 2%.
  • Стоимость: 5 руб/мин, при регистрации дарят 90 рублей.
  • Скорость: 40 секунд.
  • Знаки препинания: есть.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: хороший, чистенький перевод и стильный интерфейс. Разбивает текст на таймкоды, ставит их даже посреди предложения. Удобно, что можно тыкнуть в тайм-код и прослушать этот момент в аудиозаписи. В скачанном файле транскрибации таймкодов нет — просто текст сплошняком. Расшифровка часового созвона обойдется в 300 рублей.

6. Apihost

Apihost — солидный набор сервисов по работе с аудио и текстами. Он умеет в озвучку, изменение голоса и еще кучу всего. В том числе есть и транскрибатор. Чтобы загрузить файл, нужно зарегистрироваться. После регистрации в личном кабинете было написано, что у меня баланс ноль рублей — про бесплатные минуты я нигде ничего не нашел. Но я рискнул загрузить наш видос. И…

<p>Такой приличный сервис — и матом матерится 😂😂😂</p>

Такой приличный сервис — и матом матерится 😂😂😂

Что имеем:

  • Частота ошибок в словах: 18%
  • Стоимость: 2,4 руб/мин
  • Скорость: 25 секунд.
  • Знаки препинания: есть, какие попало.
  • Абзацы: нет.
  • Разбивка на спикеров: нет.

Вывод: ну, такое. Что матом ругается — полбеды. Что имена пишет со строчной — вообще хрен бы с ним. Но блин, неправильно определяет начало и конец предложения, сливает очевидно разные предложения в одно — длинное и бессмысленное. Получается эталонное нечитаемоеполотнотекста. За час текста — 144 рубля, пополнять можно минимум на 500 р. Максимальный размер файлов для загрузки — 200 мб, маловато.

7. Писец

И на сладенькое — я, Писец 🍬🍬🍬 Защитник обиженных и угнетенных, Робин-Гуд мира копирайтеров 🏹 …так, ладно у нас тут обзор и я к себе буду объективен. У меня всё просто: регистрироваться не надо, заходим на сайт грузим файл, указываем почту и выбираем количество спикеров — от одного до пяти. После этого можно закрыть браузер и идти пить кофе — текст я пришлю на почту ☕

<p>Я называю спикеров персонажами книги Алана Милна — нравится мне так 🐻🐽👦</p>

Я называю спикеров персонажами книги Алана Милна — нравится мне так 🐻🐽👦

Что имеем:

  • Частота ошибок в словах: 2%
  • Стоимость: бесплатно один час в месяц на высокой скорости. Потом тоже бесплатно, но медленнее.
  • Скорость: 40 секунд.
  • Знаки препинания: есть.
  • Абзацы: есть.
  • Разбивка на спикеров: есть.

Вывод: как видите, я к себе объективен. В этом видосе я недослышал одно слово в первой реплике и один раз пропустил слово «какой». При этом я крайне хорош в том, чтобы определять реплики спикеров и назначать им таймкоды.

Расшифровываю бесплатно на высокой скорости один час в месяц, а потом — тоже бесплатно, но медленнее.

А если хотите быстрее — можно купить пакет минут по оооочень демократичной стоимости:

990 ₽ за 10 часов (1.65 ₽/мин)

1620 ₽ за 20 часов (1,35 ₽/мин)

1980 ₽ за 30 часов (1,1 ₽/мин) с постобработкой в ChatGPT.

Пакеты минут не ограничены во времени использования — можете за месяц потратить или на несколько лет растянуть.

Так, ну и теперь сравнительная табличка

ТОП-7 онлайн-сервисов транскрибации: сравниваю по скорости, стоимости и количеству ошибок в тексте

Ну и вот: думайте сами, решайте сами — Писец или не Писец 🎸🎶

ТОП-7 онлайн-сервисов транскрибации: сравниваю по скорости, стоимости и количеству ошибок в тексте

Я — Писец, несравненный транскрибатор аудио и видеофайлов в текст. И я тут ничего не рекламирую, а просто приглашаю: приносите мне ваши созвончики, конференции, лекции и что там у вас еще есть.

Все расшифрую, с любовью поставлю запятые, разобью текст на абзацы и спикеров, чтобы облегчить вам жизнь и сэкономить драгоценное время.

Всех обнял 🤗

3434
12 комментариев

Старые выпуски 2х2 это просто попадание в самое сердечко

5

бггг
Юмор на котором мы выросли )

За название – отдельный лайк, спасибо за статью ))

4

А «бесплатно, но медленно» — это как? С какой скоростью расшифрует, например, часовое интервью?

1

Да по разному вобщем, бесплатные собираются в бООООООльшую очередь. Бывает за час управлюсь, а бывает и за три не успею, ибо бесплатных много а я один.

5

Хотелось бы конечно еще звать Писца на конфы в zoom или meet и получать его отчетик по встрече.

2